Die drei großen Suchmaschinenanbieter Google, Yahoo und Microsoft haben sich wieder einmal an einen Tisch gesetzt um eine Problematik zu lösen. Damals wurde zur Spambekämpfung das Linkattribut rel="nofollow" eingeführt. Wenig später gab es dann ein einheitliches XML Sitemap Protokol um den Suchmaschinenen alle Unterseiten einer Seite bekannt zu machen. Nun haben die drei "Großen" sich zusammengeschlossen um gegen das Problem des Duplicated Content vorzugehen. Die Ergebnis dieser Zusammenarbeit ist die Einführung des HTML Tags <link>, dass den Suchmaschinen mitteilen soll, welche URL die „canonical“ Url ist. Diese Canonical URL ist also die Adresse der Seite ohne Rücksicht auf z.B. die Session ID, Sortierungs- oder Linkparameter. So kann man damit Seiten wie z.B.
http://www.example.de/product_info.php?tracking=123
http://www.example.de/product_info.php?sessionid=sadfJfdsakl
http://www.example.de/product_info.php?sort=1
aus der Indexierung ausschließen und so Duplicated Content vermeiden. Das HTML Tag wird ähnlich wie das <base> Tag im <head> Bereich der Webseite definiert.
Die Syntax lautet wie folgt:
<link rel=”canonical” href=”http://www.example.de/product_info.php” />
Hier wird also einfach die Seite ohne Parameter angegeben, die für Google als eindeutige URL gelten soll. Für Wordpress, Drupal und Magento gibt es bereits schon Plugins die dieses Tag berücksichtigen.
Dies sollte vorallem bei dem leidingen Thema der SessionIDs helfen. Gerade Shopsysteme haben da so ihre Schwierigkeiten mit den Sessions. Viele Seiten haben die Session über Cookies transportiert und falls keine Cookies möglich waren, diese SessionID an die URL angehängt. Da Google ja keine Cookies akzeptiert wurden so immer die SessionIDs für Google ausgeliefert. Diesen Fehler hab ich nun schon bei zig Kunden feststellen können.
Mein Vorschlag wie man das auch ohne dem <link> Tag schaffen kann führt über die .htaccess. Hier wird z.B. Google per 301 auf eine URL ohne SessionID weitergeleitet.
RewriteEngine on
# Session IDs entfernen
RewriteCond %{QUERY_STRING} jsessionid
RewriteCond %{HTTP_USER_AGENT} Googlebot
RewriteRule .* http://%{HTTP_HOST}/? [R=301]
Ich finde die Einführung des Tags sehr sinnvoll. Problem dabei wird aber sein, dass trotzdem viele Seiten Duplicated Content erzeugen, da viele Webseitenbetreiber garnicht wissen wo DC anfängt und wie man ihn erkennen kann.
Trackback URL for this post:
Man hält es nicht für möglich, aber die großen der Branche Google, Yahoo und Microsoft haben sich zusammengesetzt und wollen etwas gegen den unbeabsichtigten Double Content tun. Ich hab´s zuerst bei Prometeo gelesen: Ganz neu ...
In den großen Suchmaschinen gibt es ja schon länger das Problem des Doppelten Inhaltes, oder auch Duplicated Content. Nun haben sich Google, Yahoo und Microsoft wieder an einen Tisch gesetzt, um auch dieses Problem zu lösen. So soll man auf der eige...
Rand hat es im SEOmoz Blog bereits geschrieben: die 3 großen Suchmaschinen Yahoo, Google und MSN haben sich zusammengesetzt um nach den Rel=nofollow und Sitemap Initiativen wieder “was neues gemeinsam zu machen”: rel=canonical. Der Tag sol...














Di, 12/08/2009 - 12:31
Also ich habe diesen TAG bisher noch nicht verwendet aber nun schon einiges darüber gelesen. Werde es bei einem aktuellen Projekt mal einbauen und sehen ob es hilfreich sein kann und sich positiv auf das Suchmaschinenranking auswirkt.
Fr, 07/17/2009 - 01:23
Hmm, sorry aber ich verstehe das nicht ganz. Auf meiner Startseite erscheint neben der URL im Browser ein kleines blaues "C". (Go to the canonical page...).
Heißt das jetzt, dass meine Startseite "nofollow" ist?
Also ich würde mich echt riesig über eine kurze Bemerkung freuen. Verstehe das nämlich nicht.
Grüße
Roman
Mi, 07/22/2009 - 12:18
nein, das ist nur eine Browserfunktion. Nofollow hat mit der Thematik eigentlich nichts zu tun.
So, 03/01/2009 - 14:21
[...] Weitere Berichte zum Thema bei JoJo und Thomas [...]
Mo, 02/23/2009 - 20:24
[...] Das Tag ist zu aufwändig, als dass es wirklich sinnvoll eingesetzt werden könnte. Dass es da unterschiedliche Meinungen gibt, brauche ich aber wohl nicht sagen. Testen ist angesagt. Vor [...]
Do, 02/19/2009 - 14:43
[...] Thomas Zeithaml beschäftigt sich mit dem neu eingeführten Rel-Tag-Attribut canonical. Welche Gründe gibt es für die Einführung, welche Funktion hat es und wie es richtig genutzt wird. [...]
Mi, 02/18/2009 - 13:07
[...] Rel Tag canonical vom Thomas Zeithaml [...]
Di, 02/17/2009 - 15:47
[...] einigen CMS und vielen Shop-Systemen zu einem Problem geworden, das hierdurch gelöst wird. Bei Thomas wird gezeigt, wie man zumindest den SessionIDs beikommen kann, ohne den neuen Tag zu benutzen, er verwendet [...]
Mo, 02/16/2009 - 17:36
[...] das ganze genau funktionieren soll, könnt Ihr auf Toms Blog nachlesen. Dieser hat das ganze schon vor ein paar Tage wirklich gut und verständlich [...]
Mo, 02/16/2009 - 14:21
Ich bin gegen dieses Tag. Es ruft einfach nur dazu auf, weiterhin schlecht zu programmieren. Ausserdem brauchen wir keine neuen proprietaeren Meta-Tags. So ein Mist.
Fr, 02/13/2009 - 17:46
[...] viel wichtiger und scheinbar noch nicht in der deutschen SEO-Szene angekommen ist, dass durch dieses Tag Linkpopularität an die [...]
Fr, 02/13/2009 - 15:37
Uhm... ist die mod_rewrite-Geschichte kein Cloaking?
Fr, 02/13/2009 - 18:03
nein das ist der einzigste Fall von Cloaking der von Google auch toleriert wird - wurde so auch von Matt Cutts bestätigt.
Fr, 02/13/2009 - 15:29
[...] ein neues Tag zur Bekämpfung von Duplicate Content eingeführt. Nähere Informationen gibt es bei Thomas Zeithaml und auf [...]
Fr, 02/13/2009 - 13:10
Nicht du gemeint - aber prinzipiell hier von einem Hype zu sprechen find ich sehr übertrieben. Im Prinzip ists ja ähnlich dem Base Tag, so eine Neuerung finde ich es nicht.
Man konnte ja bis jetzt via Robots.txt die Paramter sperren oder einfach bei den Parameter Seiten auf Noindex...
Erleichter bisschen Arbeit, aber ansonsten... :D
Fr, 02/13/2009 - 13:16
ich habe doch nichts von einem Hype geschrieben. Ich denke aber schon dass es ein wichtiger Aspekt ist - gerade in Bezug auf Session IDs. Und auch das Aussperren über die robots.txt hat nicht zu Folge dass die Seiten zusammengeführt werden. Und so hab ich den Sinn des Tags verstanden.
Wichtig ist dabei aber auch wie es die Webmaster einsetzen. Wenn man das nicht richtig macht und angenommen nur die Hauptdomain wie eben bei Base href einbaut kann man sich die Seite schön zerschiessen.
Fr, 02/13/2009 - 12:57
[...] jetzt nicht alles wieder zu kauen kann ich euch Tom Zeithamls Post “Rel Tag Canonical” empfehlen. Er hat es auf den Punkt [...]
Kommentar hinzufügen