Experimente mit dem Canonical Meta-Tag
geschrieben am 18.05.2009 von StefanBereits im Februar hat Google den Canonical Meta-Tag eingeführt. Zweck der Anweisung soll sein, das Duplicate Content-Problem zu lösen. Dazu fügt man im HEAD-Bereich der HTML-Seite eine Anweisung ein, die den Suchmaschinen (Google, Yahoo und Microsoft) mitteilt, dass die Originalversion dieser Seite womöglich unter eine anderen URL zu finden ist. Diese andere URL wird dabei natürlich ebenfalls angegeben. Der Canonical Meta-Tag sieht demnach dann so aus:
<link rel=”canonical” href=”http://www.example.com/original/” />
Soweit die langweilige Einführung zur Syntax des Canonical Tags. Spannend wird es, wenn der von URL-Umbauten genervte SEO hofft, sich – oder seinen noch mehr genervten Kunden – damit eine Konsolidierung der URLs ersparen zu können. Es soll Beratungsprojekte geben, in denen dem SEO bereits das Wort “Duplicate Content” verboten wurde …
Zwar schreibt Google in seinem Webmaster Blog über den Canonical Meta-Tag:
It also helps to make sure that properties such as link popularity are consolidated to your preferred version.
(Er hilft auch zu gewährleisten, dass solche Größen wie etwa Link Popularity auf die bevorzugte Version übertragen werden.)
Allerdings glaube ich den Mitteilungen aus dem Hause Google erst dann, wenn ich die aufgestellten Behauptungen selbst experimentell überprüfen konnte. Also habe ich vor etlichen Wochen einen kleinen Versuch aufgebaut, um die genaue Wirkungsweise des Canonical Tag zu überprüfen. Dazu erstellte ich eine Kopie namens copy.html einer bereits existierenden Seite (original.html). Diese copy.html habe ich leicht verändert: Ich habe den Titel etwas modifiziert und einen kurzen Satz mit einem recht außergewöhnlichen Wort (“WORT_A”) eingefügt; ebenso den entsprechenden Canonical Meta-Tag: <link rel=”canonical” href=”original.html”>. Das Original wie die Kopie liegen auf der selben Domain. Um Googles Behauptung, der Canonical Tag würde “Link Juice” weiterreichen, zu überprüfen, habe ich von einer fremden Domain einen Link auf die copy.html gesetzt. Der Linktext besteht dabei aus einem weiteren recht seltenen Wort: “WORT_B”. Das Szenario ist in dieser Grafik zusammengefasst:

Nachdem ich Google nun einige Wochen Zeit gelassen habe, meine Konstruktion entsprechend zu würdigen, bestätigt sich im Wesentlich das, was Google behauptet:
- Die Seite copy.html wird von Google nicht aufgenommen.
- WORT_A wird auf der Domain, auf der das Experiment durchgeführt wurde, nicht gefunden.
- WORT_B hingegen wird gefunden – und zwar auf der Seite original.html.
Ganz offensichtlich “biegt” der Canonical Meta-Tag den Link, der auf copy.html zeigt, auf die Originalseite um und weist den Linktext der original.html zu. Interessant ist auch noch ein kleiner Nebeneffekt: Die Website, auf der die Tests durchgeführt wurden, ist noch unter einer anderen Domain zu erreichen. Von dieser Spiegeldomain war bislang in Google nichts zu finden. Seit dem Experiment ist die copy.html unter der Spiegeldomain zu finden – auch bei einer Suche nach dem nur auf copy.html enthaltenen WORT_A. Anscheinend schließt Google die copy.html nur auf der Domain von einer Indexierung aus, auf der auch das Original liegt.
Was machen denn eigentlich die anderen Suchmaschinen? Yahoo nimmt “brav” die copy.html auf und findet diese Seite sowohl unter WORT_A als auch unter WORT_B. Microsofts Live Search hingegen macht’s genau anders herum: Hier ist die copy.html überhaupt nicht zu finden, und die Versuchswebsite taucht weder für WORT_A noch für WORT_B auf. Es scheint so, als würde Yahoo den Canonical Metatag gar nicht beachten, während Microsoft das “canonical” als “noindex” interpretiert.
Natürlich ist mit dem Experiment noch nicht geklärt, ob durch das Umbiegen womöglich etwas Linkpower verloren geht. Ich würde das eigentlich erwarten. Trotzdem stimmt mich das Ergebnis bei Google zuversichtlich, dass manche Optimierungen großer Redaktionssysteme, die häufig extreme Duplicate-Content-Generatoren sind, mithilfe des Canonical Meta-Tag einfacher durchgeführt werden können.
14 Kommentare
Entschuldige, das Kommentarformular ist zurzeit geschlossen.


Gerald
19. Mai 2009 08:27Hallo Stefan,
eine gut zusammengefasste Überprüfung. Sehr lustig auch was du alles so im Alltag erlebst: “Es soll Beratungsprojekte geben, in denen dem SEO bereits das Wort “Duplicate Content” verboten wurde …”
Ich hoffe demnächst mehr aus dem Kanal zu lesen *zwinker*
Grüße
Gerald
Experiment zum Canonical-Tag von Google | abtwittern
19. Mai 2009 10:44[...] und sehr anschauliches Experiment zum Canonical-Tag von Google. Stefan schafft es mit seiner Erklärung die letzten Verständnisprobleme (auch bei mir [...]
rel=”canonical” | Oblogatorisch
19. Mai 2009 11:36[...] nicht begriffen, was Google mit dem “neuen” Metatag rel=”canonical” will. Hier ein interessantes Experiment zum canonical-Metatag veröffentlicht, der bei mir reichlich Licht ins [...]
affiliate-tik.de
19. Mai 2009 11:59Experimente mit dem Canonical Meta-Tag…
Tests zum canonical meta tag auf suchmaschinentricks…
Jörg Glinka
19. Mai 2009 13:48Sehr gute Beschreibung der Tag-Wirkungsweise bei Primus Google.
Mehr solcher Praxistests bitte
Ermis-Net Social Bookmarking Service
19. Mai 2009 21:32Experimente mit dem Canonical Meta-Tag – SuchmaschinenTricks.de…
Bereits im Februar hat Google den Canonical Meta-Tag eingeführt. Zweck der Anweisung soll sein, das Duplicate Content-Problem zu lösen….
Horst
20. Mai 2009 09:48Besten Dank für den Test. Ich hatte bisher kaum Auswirkungen vom Canonical-Tag gespürt. Was die Domains angeht: Hast Du Erfahrungen wie das mit http und https aussieht? Ich habe eine Seite die über beides mit gleichen Inhalten erreichbar ist. Der Canonical-Tag lenkt nun alles auf http um. Bringt das was, oder sieht Google das als andere Domain an?
Fresh From Twitter today
21. Mai 2009 08:35[...] Experimente mit dem Canonical Meta-Tag http://bit.ly/12M6D8 #seo #hmb fresh, [...]
Notizen bei Twitter von heute
21. Mai 2009 09:49[...] Experimente mit dem Canonical Meta-Tag http://bit.ly/12M6D8 #seo [...]
Marc
21. Mai 2009 13:22So richtig ist bei mir jetzt noch nicht angekommen. Ich versteh auch nicht Richtig was Google damit bezwecken möchte.
Stefan
21. Mai 2009 15:59@Horst: Mit http und https in Sachen Duplicate Content habe ich noch keine eigenen Erfahrungen machen können. Kann dazu nicht sinnvoll weiterhelfen.
@Marc: Das ist einfach ein Hinweis an Google, welche von mehreren quasi identischen Seiten Google zum Indexieren nutzen soll.
Canonical tag Experiment
22. Mai 2009 10:58[...] funktioniert der Meta Tag wirklich oder wird er von den Suchmaschinen gar nicht beachtet? Stefan hat den canonical tag getestet, dazu hat zwei sehr ähnliche doch leicht unterschiedliche Seiten erstellt und mit dem [...]
Michael Friedrich
27. Mai 2009 11:17Danke für den sehr guten Test! All-in-one-SEO für WordPress hat in einer der letzten Versionen ebenfalls den Canonical-Tag eingeführt. Das DC-Problem auf WordPress-Blogs (Tag- und Kategorienseiten!) ist damit zwar noch nicht gelöst, aber immerhin sind die Artikel damit sauber.
Die Tag-Seiten habe ich auch mit All-in-one-SEO auf noindex, follow gesetzt. Seitdem nimmt die Anzahl der Tag-Seiten im Index stetig ab und die Bouncerate aus der Organic Search ist auch rückläufig.
Suchmaschinen & SEO – Mai 2009 - Inhouse SEO
31. Mai 2009 20:40[...] berichtet von seinen Tests mit dem Cannonical Meta-Tag. Ich kann hier nur sage, ich habe ähnliche Beobachtungen. Google reagiert auf das Tag sehr [...]