Die drei großen Suchmaschinenanbieter Google, Yahoo und Microsoft haben sich wieder einmal an einen Tisch gesetzt um eine Problematik zu lösen. Damals wurde zur Spambekämpfung das Linkattribut rel="nofollow" eingeführt. Wenig später gab es dann ein einheitliches XML Sitemap Protokol um den Suchmaschinenen alle Unterseiten einer Seite bekannt zu machen. Nun haben die drei "Großen" sich zusammengeschlossen um gegen das Problem des Duplicated Content vorzugehen. Die Ergebnis dieser Zusammenarbeit ist die Einführung des HTML Tags <link>, dass den Suchmaschinen mitteilen soll, welche URL die „canonical“ Url ist. Diese Canonical URL ist also die Adresse der Seite ohne Rücksicht auf z.B. die Session ID, Sortierungs- oder Linkparameter. So kann man damit Seiten wie z.B.

http://www.example.de/product_info.php?tracking=123
http://www.example.de/product_info.php?sessionid=sadfJfdsakl
http://www.example.de/product_info.php?sort=1

aus der Indexierung ausschließen und so Duplicated Content vermeiden. Das HTML Tag wird ähnlich wie das <base> Tag im <head> Bereich der Webseite definiert.

Die Syntax lautet wie folgt:

<link rel=”canonical” href=”http://www.example.de/product_info.php” />

 

Hier wird also einfach die Seite ohne Parameter angegeben, die für Google als eindeutige URL gelten soll. Für Wordpress, Drupal und Magento gibt es bereits schon Plugins die dieses Tag berücksichtigen.

Dies sollte vorallem bei dem leidingen Thema der SessionIDs helfen. Gerade Shopsysteme haben da so ihre Schwierigkeiten mit den Sessions. Viele Seiten haben die Session über Cookies transportiert und falls keine Cookies möglich waren, diese SessionID an die URL angehängt. Da Google ja keine Cookies akzeptiert wurden so immer die SessionIDs für Google ausgeliefert. Diesen Fehler hab ich nun schon bei zig Kunden feststellen können.

Mein Vorschlag wie man das auch ohne dem <link> Tag schaffen kann führt über die .htaccess. Hier wird z.B. Google per 301 auf eine URL ohne SessionID weitergeleitet.

 

RewriteEngine on
# Session IDs entfernen
RewriteCond %{QUERY_STRING} jsessionid
RewriteCond %{HTTP_USER_AGENT} Googlebot
RewriteRule .* http://%{HTTP_HOST}/? [R=301]

 

Ich finde die Einführung des Tags sehr sinnvoll. Problem dabei wird aber sein, dass trotzdem viele Seiten Duplicated Content erzeugen, da viele Webseitenbetreiber garnicht wissen wo DC anfängt und wie man ihn erkennen kann.

Trackback URL for this post:

http://www.thomas-zeithaml.de/blog/trackback/75
from SEO-Nord on Di, 02/17/2009 - 15:48

Man hält es nicht für möglich, aber die großen der Branche Google, Yahoo und Microsoft haben sich zusammengesetzt und wollen etwas gegen den unbeabsichtigten Double Content tun. Ich hab´s zuerst bei Prometeo gelesen: Ganz neu ...

from www.der-nette-seo.de on Di, 02/17/2009 - 15:08

In den großen Suchmaschinen gibt es ja schon länger das Problem des Doppelten Inhaltes, oder auch Duplicated Content. Nun haben sich Google, Yahoo und Microsoft wieder an einen Tisch gesetzt, um auch dieses Problem zu lösen. So soll man auf der eige...

from Frank the Tank on Fr, 02/13/2009 - 12:58

Rand hat es im SEOmoz Blog bereits geschrieben: die 3 großen Suchmaschinen Yahoo, Google und MSN haben sich zusammengesetzt um nach den Rel=nofollow und Sitemap Initiativen wieder “was neues gemeinsam zu machen”: rel=canonical. Der Tag sol...