<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SuchmaschinenTricks.de &#187; duplicate content</title>
	<atom:link href="http://www.suchmaschinentricks.de/aktuelles/tag/duplicate-content/feed" rel="self" type="application/rss+xml" />
	<link>http://www.suchmaschinentricks.de</link>
	<description>Das deutsche Suchmaschinen-Magazin.</description>
	<lastBuildDate>Tue, 07 Sep 2010 15:25:34 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
		<item>
		<title>Google Sommerloch-Update oder einfach Mayday 2?</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/ranking/1234.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/ranking/1234.php#comments</comments>
		<pubDate>Mon, 09 Aug 2010 11:49:15 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[ranking]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[update]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1234</guid>
		<description><![CDATA[Update! Kommando zurück, die Aufregung war umsonst. Dieses Mal gab&#8217;s kein Google-Update, sondern die Sistrix Toolbox hatte einen kleinen Schluckauf. Mit einer Ausnahme, lagen die Änderungen bei den betrachteten Websites bei unter drei Prozent. Trotzdem können wir daraus viel lernen: Wenn DAUs schreien, das Internet sei kaputt, dann ist ausnahmsweise Google nicht erreichbar. Und wenn [...]]]></description>
			<content:encoded><![CDATA[<p><b>Update!</b> <em>Kommando zurück, die Aufregung war umsonst. Dieses Mal gab&#8217;s kein Google-Update, sondern die Sistrix Toolbox hatte einen kleinen Schluckauf. Mit einer Ausnahme, lagen die Änderungen bei den betrachteten Websites bei unter drei Prozent.</p>
<p>Trotzdem können wir daraus viel lernen: Wenn DAUs schreien, das Internet sei kaputt, dann ist ausnahmsweise Google nicht erreichbar. Und wenn wir SEOs schreien, Google macht schon wieder Update, dann hat ausnahmsweise Sistrix falsche Daten &#8230;</em></p>
<p><img src="http://www.suchmaschinentricks.de/wp-content/uploads/2010/08/si-aug2010.png" alt="Sichtbarkeitsindex August 2010" title="Änderung Sichtbarkeitsindex August 2010" width="183" height="206" align="right" /></p>
<p>Anfang Mai gab&#8217;s das Mayday-Update, das zu etlichen Verlusten etablierter Websites im Longtail-Bereich führte. Davon waren auch Websites von Kunden betroffen, so dass ich seither neben diesen Kundensites eine Menge an Websites regelmäßig begutachte, die eine ähnliche Charakteristik aufweisen. Wie ich heute beim Check dieser Websites feststelle, haben sich die Sichtbarkeitsindizes gerade der Sites deutlich verschlechtert, die beim Mayday-Update vor drei Monaten relativ ungeschoren davon kamen.</p>
<p>Hier eine Auflistung von Websites und deren aktuelle Verluste des Sichtbarkeitsindex gegenüber der Vorwoche. In der dritten Spalte zum Vergleich die Änderungen während des Mayday-Updates vom 26. April bis zum 17. Mai.</p>
<table class="intexttable">
<tr>
<th>Website</th>
<th>Veränderung SI/jetzt</th>
<th>Veränderung SI/Mayday</th>
</tr>
<tr>
<td>Site 1</td>
<td>-12,9%</td>
<td>0,0%</td>
</tr>
<tr>
<td>Site 2</td>
<td>-8,4%</td>
<td>11,9%</td>
</tr>
<tr>
<td>Site 3</td>
<td>-9,6%</td>
<td>1,3%</td>
</tr>
<tr>
<td>Site 4</td>
<td>-8,0%</td>
<td>-0,9%</td>
</tr>
<tr>
<td>Site 5</td>
<td>-10,9%</td>
<td>6,1%</td>
</tr>
<tr>
<td>Site 6</td>
<td>-12,8%</td>
<td>-4,3%</td>
</tr>
<tr>
<td>Site 7</td>
<td>-11,6%</td>
<td>3,7%</td>
</tr>
<tr>
<td>Site 8</td>
<td>-8,1%</td>
<td>-6,4%</td>
</tr>
<tr>
<td>Site 9</td>
<td>-7,5%</td>
<td>-5,9%</td>
</tr>
<tr>
<td>Site 10</td>
<td>-7,1%</td>
<td>8,7%</td>
</tr>
</table>
<p>Diese Websites stammen aus drei verschiedenen Branchen. Der Sichtbarkeitsindex reicht von 7 bis etwa 80. Auch bei den aktuellen Änderungen scheinen vor allem wieder die Longtail-Rankings eine Rolle zu spielen. Allen ist gemeinsam, dass die Anzahl der Keywords, unter denen sie in den Top100 zu finden waren, deutlich weniger wurden. Und alle Websites haben eine nicht unerhebliche Menge an Seiten mit sehr wenig Content im Index &#8211; es passen also wieder genau jene Beschreibungen wie bereits zum Mayday-Update. Habt Ihr ähnliche Erfahrungen? Beobachtungen? Erklärungen?</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/ranking/1234.php/feed</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
		<item>
		<title>Experimente mit dem Canonical Meta-Tag</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/news/810.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/news/810.php#comments</comments>
		<pubDate>Mon, 18 May 2009 16:46:15 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[News]]></category>
		<category><![CDATA[canonical]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[metatag]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[noindex]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[topthema]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=810</guid>
		<description><![CDATA[Bereits im Februar hat Google den Canonical Meta-Tag eingeführt. Zweck der Anweisung soll sein, das Duplicate Content-Problem zu lösen. Dazu fügt man im HEAD-Bereich der HTML-Seite eine Anweisung ein, die den Suchmaschinen (Google, Yahoo und Microsoft) mitteilt, dass die Originalversion dieser Seite womöglich unter eine anderen URL zu finden ist. Diese andere URL wird dabei [...]]]></description>
			<content:encoded><![CDATA[<p>Bereits im Februar hat Google den Canonical Meta-Tag <a href="http://googlewebmastercentral.blogspot.com/2009/02/specify-your-canonical.html">eingeführt</a>. Zweck der Anweisung soll sein, das <a href="http://www.suchmaschinentricks.de/aktuelles/blog/521.php">Duplicate Content</a>-Problem zu lösen. Dazu fügt man im HEAD-Bereich der HTML-Seite eine Anweisung ein, die den Suchmaschinen (Google, Yahoo und Microsoft) mitteilt, dass die Originalversion dieser Seite womöglich unter eine anderen URL zu finden ist. Diese andere URL wird dabei natürlich ebenfalls angegeben. Der Canonical Meta-Tag sieht demnach dann so aus:</p>
<blockquote><p>&lt;link rel=&#8221;canonical&#8221; href=&#8221;http://www.example.com/original/&#8221; /&gt;</p></blockquote>
<p>Soweit die langweilige Einführung zur Syntax des Canonical Tags. Spannend wird es, wenn der von URL-Umbauten genervte SEO hofft, sich &#8211; oder seinen noch mehr genervten Kunden &#8211; damit eine Konsolidierung der URLs ersparen zu können. Es soll Beratungsprojekte geben, in denen dem SEO bereits das Wort &#8220;Duplicate Content&#8221; verboten wurde &#8230;</p>
<p>Zwar schreibt Google in seinem Webmaster Blog über den Canonical Meta-Tag:</p>
<blockquote><p>It also helps to make sure that properties such as link popularity are consolidated to your preferred version.<br />
(Er hilft auch zu gewährleisten, dass solche Größen wie etwa <a href="http://www.suchmaschinentricks.de/lexikon/link-popularity">Link Popularity</a> auf die bevorzugte Version übertragen werden.)</p></blockquote>
<p>Allerdings glaube ich den Mitteilungen aus dem Hause Google erst dann, wenn ich die aufgestellten Behauptungen selbst experimentell überprüfen konnte. Also habe ich vor etlichen Wochen einen kleinen Versuch aufgebaut, um die genaue Wirkungsweise des Canonical Tag zu überprüfen. Dazu erstellte ich eine Kopie namens <em>copy.html</em> einer bereits existierenden Seite (<em>original.html</em>). Diese copy.html habe ich leicht verändert: Ich habe den Titel etwas modifiziert und einen kurzen Satz mit einem recht außergewöhnlichen Wort (&#8220;WORT_A&#8221;) eingefügt; ebenso den entsprechenden Canonical Meta-Tag: &lt;link rel=&#8221;canonical&#8221; href=&#8221;original.html&#8221;&gt;. Das Original wie die Kopie liegen auf der selben Domain. Um Googles Behauptung, der Canonical Tag würde &#8220;Link Juice&#8221; weiterreichen, zu überprüfen, habe ich von einer fremden Domain einen Link auf die copy.html gesetzt. Der Linktext besteht dabei aus einem weiteren recht seltenen Wort: &#8220;WORT_B&#8221;. Das Szenario ist in dieser Grafik zusammengefasst:</p>
<p><img src="http://www.suchmaschinentricks.de/wp-content/uploads/2009/05/canonical-experiment.png" alt="canonical-experiment" title="canonical-experiment" width="550" height="600" class="alignnone size-full wp-image-812" /></p>
<p>Nachdem ich Google nun einige Wochen Zeit gelassen habe, meine Konstruktion entsprechend zu würdigen, bestätigt sich im Wesentlich das, was Google behauptet:</p>
<ul>
<li>Die Seite copy.html wird von Google nicht aufgenommen.</li>
<li>WORT_A wird auf der Domain, auf der das Experiment durchgeführt wurde, nicht gefunden.</li>
<li>WORT_B hingegen wird gefunden &#8211; und zwar auf der Seite original.html.</li>
</ul>
<p>Ganz offensichtlich &#8220;biegt&#8221; der Canonical Meta-Tag den Link, der auf copy.html zeigt, auf die Originalseite um und weist den Linktext der original.html zu. Interessant ist auch noch ein kleiner Nebeneffekt: Die Website, auf der die Tests durchgeführt wurden, ist noch unter einer anderen Domain zu erreichen. Von dieser Spiegeldomain war bislang in Google nichts zu finden. Seit dem Experiment ist die copy.html unter der Spiegeldomain zu finden &#8211; auch bei einer Suche nach dem nur auf copy.html enthaltenen WORT_A. Anscheinend schließt Google die copy.html nur auf der Domain von einer Indexierung aus, auf der auch das Original liegt.</p>
<p>Was machen denn eigentlich die anderen Suchmaschinen? Yahoo nimmt &#8220;brav&#8221; die copy.html auf und findet diese Seite sowohl unter WORT_A als auch unter WORT_B. Microsofts Live Search hingegen macht&#8217;s genau anders herum: Hier ist die copy.html überhaupt nicht zu finden, und die Versuchswebsite taucht weder für WORT_A noch für WORT_B auf. Es scheint so, als würde Yahoo den Canonical Metatag gar nicht beachten, während Microsoft das &#8220;canonical&#8221; als &#8220;noindex&#8221; interpretiert.</p>
<p>Natürlich ist mit dem Experiment noch nicht geklärt, ob durch das Umbiegen womöglich etwas Linkpower verloren geht. Ich würde das eigentlich erwarten. Trotzdem stimmt mich das Ergebnis bei Google zuversichtlich, dass manche Optimierungen großer Redaktionssysteme, die häufig extreme Duplicate-Content-Generatoren sind, mithilfe des Canonical Meta-Tag einfacher durchgeführt werden können.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/news/810.php/feed</wfw:commentRss>
		<slash:comments>14</slash:comments>
		</item>
		<item>
		<title>Die schönsten technischen SEO-Fehler</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/seo/696.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/seo/696.php#comments</comments>
		<pubDate>Tue, 14 Oct 2008 12:55:09 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[404]]></category>
		<category><![CDATA[CMS]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[googlebot]]></category>
		<category><![CDATA[javascript]]></category>
		<category><![CDATA[Weiterleitungen]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/aktuelles/seo/696.php</guid>
		<description><![CDATA[Suchmaschinenoptimierung ist ein Allround-Thema. Marketing- und Design-Kenntnisse spielen ebenso eine Rolle wie das Wissen um technische Zusammenhänge. Mein Eindruck aus Beratungsprojekten der letzten Monate ist nun, dass sich die Bedeutung von SEO in Marketing- und sogar in Entscheiderkreisen weitgehend etabliert hat. Unter Technikern hingegen erscheint mir das Wissen um suchmaschinenfreundliche Technik immer noch recht rar [...]]]></description>
			<content:encoded><![CDATA[<p>Suchmaschinenoptimierung ist ein Allround-Thema. Marketing- und Design-Kenntnisse spielen ebenso eine Rolle wie das Wissen um technische Zusammenhänge. Mein Eindruck aus Beratungsprojekten der letzten Monate ist nun, dass sich die Bedeutung von SEO in Marketing- und sogar in Entscheiderkreisen weitgehend etabliert hat. Unter Technikern hingegen erscheint mir das Wissen um suchmaschinenfreundliche Technik immer noch recht rar zu sein. Daraus leitet sich die erste Regel für SEO-Consultants ab. Sie lautet:</p>
<blockquote><p>Sei auf alles gefasst &#8211; und bereite dich darauf vor, trotzdem überrascht zu werden.</p></blockquote>
<p>Als Anregung für alle Techies, deren SEO-Kenntnisse noch in den Kinderschuhen stecken, stelle ich hier ein paar der herausragendsten Fehler zusammen, die mir zuletzt in Beratungsprojekten untergekommen sind. Dabei geht es nicht darum, irgendwen bloß zu stellen. Die aufgeführten Lösungen funktionieren alle und sind aus rein technischer Sicht absolut in Ordnung. Suchmaschinen-Robots stellen allerdings hie und da andere Anforderungen.</p>
<ol>
<li><strong>&#8220;Seite nicht gefunden&#8221;-Seiten zeigen Statuscode 200</strong><br />
Auf klassischen HTML-Websites ohne Datenbank-Unterstützung war die Sache einfach. Konnte der Webserver eine Seite nicht finden, schickte er eine (eventuell zuvor passende gestaltete) Fehlerseite als Antwort und dazu den Statuscode 404. Dieser Code sagt dem Client, also dem Webbrowser oder dem Robot der Suchmaschine, dass die gewünschte Seite nicht auffindbar ist. Für die Suchmaschine heißt das also: Ich nehme diese Seite nicht auf bzw. lösche sie, falls vorhanden, aus meinem Index.<br />
Die heutigen Redaktionssysteme fangen solche Situationen meist ab; ein Request auf eine unbekannte URL dringt erst gar nicht bis zum Webserver durch. Denn ein CMS ist ja häufig so konzipiert, dass sich die URLs erst gar nicht als Datei auf dem Server befinden, sondern erst bei einer Anfrage aus der Datenbank generiert werden. Also ist das CMS für die Erstellung der Fehlerseiten zuständig &#8211; etwa dann, wenn ein Artikel aus der Datenbank gelöscht wurde.<br />
Kommt nun aber eine Anfrage nach einem solch gelöschten Artikel, sollte das CMS einen Statuscode 404 zurückliefern, damit die Suchmaschinenrobots wissen, dass der Artikel nicht mehr existiert. Ich habe aber mehr als nur einmal Kundenprojekte vorgefunden, die in einem solchen Fall einfach den Inhalt der Startseite mit dem Statuscode 200 (heißt so viel wie &#8220;alles okay&#8221;) zurückgeliefert haben.<br />
Das Ergebnis dieser Konfiguration: Das System läuft jahrelang wunderbar, auch Google hat nichts auszusetzen, denn 404-Fehler kommen selten vor. Eine Umstellung des URL-Schemas aber führt zu komplett neuen URLs mit der Konsequenz, dass die vielen externen Links auf Unterseiten zu 404-Fehlern führen. Das System sendet aber einen Statuscode 200 und Google nimmt somit unter den URLs des alten Schemas jeweils den Inhalt der Startseite auf. Irgendwann wird es Google zu viel und die Website wird wegen des so erzeugten <a href="http://www.suchmaschinentricks.de/aktuelles/tag/duplicate-content">Duplicate Contents</a> abgestraft.</li>
<li><strong>Interne Fehler ergeben Statuscode 404</strong><br />
Interessanterweise kommt auch der umgekehrte Fall in der Praxis vor. Dort wo ein Statuscode 500, der einen internen Fehler anzeigt, oder vielleicht Statuscode 408, der auf einen Timeout hinweist, angebracht wäre, wird ein Statuscode &#8220;404 &#8211; Seite nicht gefunden&#8221; gesendet. Die Reaktion von Google darauf ist klar: Anstatt die Seite etwas später nochmals zu besuchen, wird die URL aus dem Index gelöscht. Da bei einem neuen Crawl die URL aber wieder über die interne Navigation auftaucht, wird Google die Seite künftig wieder aufnehmen &#8211; falls dann technisch alles in Ordnung ist. Deshalb fällt dieser Fehler selten unmittelbar auf. Wenn solche Fehler aber zusammen mit anderen Problemen auftreten, kann dies ein weiteres Mosaiksteinchen für erhebliche Google-Probleme sein.<br />
Auch dies ist ein Fehler, der gerne zusammen mit &#8220;geschickt&#8221; programmierten Inhouse-Redaktionssystemen oder besonders innovativen Web-Frameworks auftritt.</li>
<li><strong>Wackelige Technik</strong><br />
Spätestens mit Ruby on Rails wurden die MVC-Frameworks sehr beliebt. Und in der Tat erlauben es diese Frameworks, komplexe Websites in kürzester Zeit aufzusetzen. Doch kommt Bequemlichkeit selten umsonst: Um all die schicken Features zu ermöglichen, sind im Hintergrund viele Datenbankzugriffe nötig und werden allerhand Verrenkungen angestellt. Nicht selten ist das Ergebnis eine Website, die nicht wirklich stabil läuft. Zwar sind Nutzer wie Suchmaschinen-Robots in Web-2.0-Alles-ist-Beta-Zeiten temporären Aussetzern recht tolerant gegenüber; trotzdem ist eine instabile Plattform, nun ja halt eine instabile Plattform. Gelegentliche Nichterreichbarkeit ist für Google nicht sofort ein Killerkriterium, doch in Kombination mit anderen Problemen kann es der Auffindbarkeit der Website sehr wohl schaden. Deshalb gehört zu einer ordentlich Suchmaschinenoptimierung auch, das technische Fundament sauber zu legen.</li>
<li><strong>URL-basiertes Load Balancing</strong><br />
Stellt euch vor, euch gehört eine uralte und höchst etablierte Website mit sehr viel eigenständigem Content. Irgendwann macht ihr sogar etwas SEO dafür und der sowieso schon ordentliche Traffic steigt weiter an. Nun ergibt sich die Notwendigkeit, für die Website ein Load Balancing einzuführen. Welche Art des Load Balancing solltet ihr auf keinen Fall einsetzen? Genau: Ein Load Balancing, das jeden Request auf <code>www.example.com</code> zufällig auf <code>www1.example.com</code> oder <code>www2.example.com</code> weiterleitet!<br />
Genau das hat ein Kunde (bevor er mein Kunde war *g*) aber gemacht, mit der schönen Konsequenz, dass Google die Website plötzlich ganz schlecht (Duplicate Content!) fand und der Suchmaschinentraffic entsprechend eingebrochen ist. Wieso jemand auf die Idee kommt, eine derartige Pseudo-Lösung einzusetzen? Nun ja, im konkreten Fall war das Load Balancing keine technische Notwendigkeit, sondern eher eine politische Vorgabe, weil zwei der Gesellschafter eigene Rechenzentren hatten und die Website sollte in beiden Rechenzentren gehostet werden.</li>
<li><strong>URLs werden ohne Not geändert</strong><br />
Daraus lernen wir eine weitere Lektion für jeden Webmaster: Ändere nie die URLs, wenn es keine zwingenden Gründe dafür gibt. Und mit URL ist alles gemeint, angefangen vom <code>http</code> bis zum abschließenden <code>.php</code>. Wobei URLs mit der Endung <code>.php</code> sowieso eine ganz schlechte Idee sind. Will man diese Endung auch in fünf Jahren noch nutzen, wenn das System längst unter Ruby on Rails, Python on Paths oder Scheme on Streets läuft?</li>
<li><strong>Weiterleitungen zum Cookie-Setzen</strong><br />
Ein Kunde hatte diese Aufgabenstellung: Kommt ein Nutzer auf die Website, muss sofort ein Cookie gesetzt werden, um eine Session zu starten. Denn schon auf der ersten Seite, egal ob Homepage oder Unterseite, muss eine Session-ID vorliegen, um AJAX-basierte Funktionalitäten nutzen zu können. Gelöst wurde diese Aufgabe zunächst dadurch, dass eine Weiterleitungsantwort (Statuscode 302) mit einem entsprechenden <code>Set-Cookie</code>-Header gesendet wurde. Die Weiterleitung erfolgte auf eine zweite Version der Seite, indem einfach ein Parameter angehängt wurde. Diese zweite Seitenversion konnte dann sofort erkennen, ob der aufrufende Client das gesetzte Cookie angenommen hat und entsprechend die Funktionalität bereitstellen.<br />
Google fand diese Lösung nicht so schick. Denn der Googlebot sah die verlinkten URLs (erste Version) als auch die Ziel-URLs (zweite Version). Da es sich um eine 302-Weiterleitung handelte, fing er zunächst an, beide URLs aufzunehmen. Dann aber strafte er die Seiten im Ranking ab, denn die massenhaften Weiterleitungen gefielen ihm gar nicht.<br />
Hierfür eine sinnvolle Lösung zu finden, ist gar nicht so einfach. Mein Vorschlag, das Cookie gleich im <code>&lt;head&gt;</code> der ersten (und damit einzigen) Version per JavaScript zu setzen, fand mein Kunde nicht so schick. Dafür setzten sie eine andere, gefährliche Lösung um: Die 302-Weiterleitung wird nur gesendet, wenn der Zugriff nicht von einem Googlebot stammt. Natürlich ist das <a href="http://www.suchmaschinentricks.de/technik/suchmaschinen-cloaking">Cloaking</a> und natürlich habe ich auf die damit verbundenen Gefahren hingewiesen. Aber letztendlich ist der Kunde Herr der Umsetzung &#8211; und muss die eventuell eintretenden Konsequenzen tragen. Bisher klappt aber diese gefährliche Lösung. Noch.</li>
<li><strong>JavaScript Browserweiche</strong><br />
JavaScript ist ein ewiger Quell spannender SEO-Probleme. Mein Lieblings-JavaScript-Fehler liegt nun schon etliche Jahre zurück, aber das soll nicht heißen, dass derartige Methoden heute nicht mehr eingesetzt würden.<br />
Die Website, auf der diese Lösung im Einsatz war, hatte wunderbaren Inhalt, der in dieser Qualität und Tiefe nirgendwo sonst im Web vorkam. Die Site war zudem bestens verlinkt, denn es handelte sich um einen kleinen, aber feinen Fernsehsender mit durchaus hohem Bekanntheitsgrad. An sich wunderbare Voraussetzungen für beste Platzierungen in Google. Doch das Problem zeigte sich sehr schnell: Von den etwa 4.000 Seiten mit tollem Content hatte Google nur zwei Seiten, darunter die Homepage, aufgenommen.<br />
Der Grund dafür war eine JavaScript-Browserweiche, die in einem <code>noscript</code>-Tag eine Meta-Refresh-Weiterleitung auf eine Hinweisseite enthielt. Auf dieser Hinweisseite war dann zu lesen, dass zur Nutzung der Website JavaScript benötigt würde und der Nutzer doch einen JavaScript-fähigen Browser installieren solle. Google folgte brav dieser Weiterleitung und nahm außer der Homepage nur diese Hinweisseite auf.<br />
Kaum war die alberne Browserweiche entfernt, nahm Google die Seiten auf, der Traffic stieg rapide und alle waren glücklich. Denn der eigentliche Clou dieser Geschichte ist, dass die Website auch ohne JavaScript problemlos zu nutzen war.</li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/seo/696.php/feed</wfw:commentRss>
		<slash:comments>29</slash:comments>
		</item>
		<item>
		<title>Google schreibt schon wieder über Duplicate Content</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/google/688.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/google/688.php#comments</comments>
		<pubDate>Sat, 13 Sep 2008 10:02:56 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[reinclusion request]]></category>
		<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/aktuelles/google/688.php</guid>
		<description><![CDATA[Langsam wird&#8217;s zur Routine: Schon wieder schreibt Google, dass es kein Duplicate Content-Problem gebe. Dieses Mal wird der Ton geradezu flehentlich; erfahrene Webmaster sollten den &#8220;Mythos der Duplicate Content-Penalties nicht weiter verbreiten&#8221;, heißt es dort. Denn ständig, so die Google-Blogger, würden besorgte User nachfragen und Reinclusion Requests stellen. Offenbar, so ist das zu verstehen, ist [...]]]></description>
			<content:encoded><![CDATA[<p>Langsam wird&#8217;s zur Routine: Schon wieder <a href="http://googlewebmastercentral-de.blogspot.com/2008/09/die-duplicate-content-penalty.html">schreibt Google</a>, dass es kein <a href="http://www.suchmaschinentricks.de/aktuelles/blog/592.php">Duplicate Content-Problem</a> gebe. Dieses Mal wird der Ton geradezu flehentlich; erfahrene Webmaster sollten den &#8220;Mythos der Duplicate Content-Penalties nicht weiter verbreiten&#8221;, heißt es dort. Denn ständig, so die Google-Blogger, würden besorgte User nachfragen und Reinclusion Requests stellen. Offenbar, so ist das zu verstehen, ist das Anti-Spam-Team ziemlich angefressen von den ständigen Nachfragen zu diesem Thema.</p>
<blockquote><p>Lasst uns also eines ein für alle Mal klarstellen: Es gibt keine &#8220;Duplicate Content-Penalty&#8221;.</p></blockquote>
<p>Das klingt so überzeugend, dass man fast glauben könnte, Google hätte das Problem nun endgültig gelöst. Doch in der weiteren Folge finden sich eine ganze Reihe von Einschränkungen dieser Kernaussage &#8211; alle zusammengenommen ergibt sich ein ganz anderes Bild zum <a href="http://www.suchmaschinentricks.de/aktuelles/tag/duplicate-content">Thema Duplicate Content</a>.</p>
<p>Zunächst stellt Google klar, dass Duplicate Content auf <em>unterschiedlichen Websites</em>, sei es durch Scraping oder Partnerprogramme erzeugt, sehr wohl ein Problem ist und zur Abstrafung führen kann:</p>
<blockquote><p>Es gibt einige Penalties, die mit dem Konzept zusammenhängen, dass eine Site den gleichen Content hat wie eine andere Site. (..) Wenn ihr beispielsweise Content wiederveröffentlicht ohne Mehrwert hinzuzufügen.</p></blockquote>
<p>Doch schon Duplicate Content <em>innerhalb einer Website</em>, so wie ihn viele CMS von Haus aus erzeugen, kann zu Schwierigkeiten führen &#8211; falls Google glaubt, das geschehe, um zu manipulieren:</p>
<blockquote><p>Duplizierter Content auf einer Website ist kein Grund für Maßnahmen gegen diese Website, außer es scheint, dass mit diesem duplizierten Content Nutzer getäuscht bzw. Suchmaschinenergebnisse manipuliert werden sollen.</p></blockquote>
<p>Der ganze Artikel liest sich wie die alten <a href="http://de.wikipedia.org/wiki/Radio_Eriwan">Radio Eriwan-Witze</a>, die leider außer Mode gekommen sind:</p>
<ul>
<li>Frage an die Google Webmaster-Zentrale:<br />
	Kann Duplicate Content meiner Website schaden?</li>
<li>Anwort der Google Webmaster-Zentrale:<br />
	Im Prinzip nein. Außer ihr habt Pech.</li>
</ul>
<p>Wer sich auf das Glücksspiel also nicht einlassen möchte, sollte sich auch weiterhin um das Thema Duplicate Content ernsthaft kümmern.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/google/688.php/feed</wfw:commentRss>
		<slash:comments>11</slash:comments>
		</item>
		<item>
		<title>Googles gewagte Tipps zu Duplicate Content</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/blog/592.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/blog/592.php#comments</comments>
		<pubDate>Fri, 22 Jun 2007 14:48:50 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=592</guid>
		<description><![CDATA[Für jeden, der sich mit Suchmaschinen-Optimierung beschäftigt, ist Duplicate Content ein Ärgernis. Denn oft genug kommt man nicht daran vorbei, Duplicate Content zu vermeiden. Als Stichworte mögen hier Syndication durch Feeds oder das übliche Tagging von Blogs in diversen Kategorien ausreichen, von Scrapern, die die eigenen Inhalte stehlen, soll erst gar nicht geredet werden. In [...]]]></description>
			<content:encoded><![CDATA[<p>Für jeden, der sich mit Suchmaschinen-Optimierung beschäftigt, ist <a href="http://www.suchmaschinentricks.de/lexikon/duplicate-content/">Duplicate Content</a> ein Ärgernis. Denn oft genug kommt man nicht daran vorbei, Duplicate Content zu vermeiden. Als Stichworte mögen hier Syndication durch Feeds oder das übliche Tagging von Blogs in diversen Kategorien ausreichen, von Scrapern, die die eigenen Inhalte stehlen, soll erst gar nicht geredet werden.</p>
<p>In einem heute auf deutsch erschienenen <a href="http://googlewebmastercentral-de.blogspot.com/2007/06/duplicate-content-session-auf-der-smx.html">Artikel</a> nimmt Vanessa Fox vom <em>Google Webmaster Central Blog</em> anlässlich einer Diskussion auf einer Suchmaschinenkonferenz nochmals dazu Stellung. Neben einigen interessanten Ansätzen, was Google denn tun könnte, um Duplicate Content-Probleme für legitime Webseiten zu verhindern, veröffentlicht Google hier wieder einige Aussagen, die zumindest missverständlich sein könnten; ich würde sie eher als falsch bezeichnen.</p>
<blockquote><p>Duplicate Content führt nicht dazu, dass eure Site in die Supplemental Results rutscht. Allerdings kann dies indirekt ausgelöst werden, falls verschiedene Links auf die unterschiedlichen Versionen eurer Seite zeigen und so einen niedrigeren PageRank verursachen.</p></blockquote>
<p>In dieser Aussage kommt es auf die feine Unterscheidung zwischen Site und Seite an. Sicherlich rutscht eine komplette Website nicht als ganzes in den Zusatzindex ab, nur weil viel Duplicate Content auf dieser Site zu finden ist. Das Problem ist ja vielmehr, dass Google Seiten als Duplikate qualifiziert und in den Zusatzindex schiebt, die keine Duplikate sind oder zumindest keine sein sollten. Gleichzeitig bestätigt diese Aussage, dass ein niedriger PageRank ein wichtiges Kriterium dafür ist, ob eine Seite in den Haupt- oder den Zusatzindex gesteckt wird.</p>
<blockquote><p>Duplicate Content auf eurer Site führt nicht zu Penalties. Wenn doppelte Seiten erkannt werden, taucht im Interesse der Ergebnisvielfalt nur eine Version in den Suchergebnissen auf.</p></blockquote>
<p>Klingt gut, allein mir fehlt der Glaube. Denn ich habe Websites gesehen, die in der Tat nicht als ganzes im Zusatzindex landeten, von denen aber zu einzelnen Artikeln keine einzige Version in Googles Index zu finden war. (Eines dieser Beispiele habe ich auf meiner <a href="http://www.suchmaschinen-video.de/">Suchmaschinen-Trainings-DVD</a> vorgestellt.)</p>
<blockquote><p>Google will einmalige Ergebnisse liefern und wählt deswegen automatisch eine Version aus, falls eure Websites Duplicate Content aufweisen. Falls ihr euch also nicht die Mühe machen wollt, eure Duplikate auszusieben, könnt ihr einfach uns dafür Sorge tragen lassen.</p></blockquote>
<p>Angesichts der vielen Probleme, die ich auf diversen Seiten dank Duplicate Content sehe, ist dieser Rat mit Sicherheit vollkommen unsinnig, ja schon fast zynisch. Vor allem wenn ich mir anschaue, welch <a href="http://googlewebmastercentral-de.blogspot.com/2007/03/duplicate-content-best-practice-bei_08.html">ausgiebige Hilfestellungen</a> Google gibt, um Duplicate Content zu vermeiden.</p>
<p>Duplicate Content ist also nach wie vor ein richtiges Problem für jeden Webmaster, auch wenn Google derzeit versucht, uns das Gegenteil einzureden.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/blog/592.php/feed</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Zusätzliches Ergebnis &#8211; Google erklärt warum</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/news/588.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/news/588.php#comments</comments>
		<pubDate>Tue, 01 May 2007 10:26:34 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[News]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[zusätzliches ergebnis]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=588</guid>
		<description><![CDATA[Einen Artikel auf der Forbes.com-Website mit dem schicken Titel In die Google-Hölle verdammt nimmt Matt Cutts von Google als Anlass, nochmals auf die Problematik &#8220;Zusätzliches Ergebnis&#8221; einzugehen. Cutts verdeutlicht darin, dass es für Websites ganz normal sei, dass Seiten im sogenannten Zusatzindex landeten; insbesondere sei dies kein Anzeichen für eine Abstrafung der Website wegen Spam [...]]]></description>
			<content:encoded><![CDATA[<p>Einen Artikel auf der Forbes.com-Website mit dem schicken Titel <a href="http://www.forbes.com/home/technology/2007/04/29/sanar-google-skyfacet-tech-cx_ag_0430googhell.html">In die Google-Hölle verdammt</a> nimmt <a href="http://www.mattcutts.com/blog/google-hell/">Matt Cutts</a> von Google als Anlass, nochmals auf die Problematik &#8220;Zusätzliches Ergebnis&#8221; einzugehen. Cutts verdeutlicht darin, dass es für Websites ganz normal sei, dass Seiten im sogenannten Zusatzindex landeten; insbesondere sei dies kein Anzeichen für eine Abstrafung der Website wegen Spam oder <a href="http://www.suchmaschinentricks.de/lexikon/duplicate-content/">Duplicate Content</a>. Der entscheidende Faktor, ob eine Seite in den Zusatzindex rutscht, ist der <a href="http://www.suchmaschinentricks.de/lexikon/pagerank/">PageRank-Wert</a> dieser Seite.</p>
<p>Soweit Matt Cutts. Doch müssen seine Ausführungen ergänzt werden, oder zumindest sollte der geneigte Suchmaschinenoptimierer genau lesen, was da steht. Wenn Cutts schreibt, dass das &#8220;Zusätzliche Ergebnis&#8221; kein Anzeichen für eine Abstrafung ist, dann heißt das eben auch: Natürlich können Seiten zur &#8220;Strafe&#8221; für Spam oder Duplicate Content in den Zusatzindex wandern.</p>
<p>Und zum guten alten PageRank. Anders als oftmals zu lesen ist, hat er natürlich noch einen erheblichen Einfluss aufs Google-Ranking. Natürlich nicht im engeren Sinne, dass Seiten mit hohem PageRank besonders weit vorne stehen. (Aber dafür war der PageRank meines Erachtens eh schon immer überbewertet.) Der PageRank ist heute für andere Dinge wichtig, etwa dafür, wie viele Seiten von Google aufgenommen werden und ob diese Seiten im Haupt- oder im Zusatzindex landen.</p>
<p>Doch auch hier ist Matt Cutts etwas halbherzig. Ich habe Seiten gesehen, die intern bestens verlinkt waren, auf einer seit vielen Jahren etablierten deutschen Website mit PageRank 7 lagen und trotzdem im Zusatzindex landeten. Der Grund war wohl eine Mischung aus Duplicate Content und fehlenden externen Deep-Links. Das heißt, dass selbst ein guter PageRank für eine Seite nicht ausreicht, im Hauptindex zu landen, wenn andere Faktoren dagegen sprechen.</p>
<p>Wie fast immer bei der Google-Optimierung in letzter Zeit gibt es ein Wundermittel gegen das &#8220;Zusätzliches Ergebnis&#8221;-Problem: Eine möglichst <a href="http://www.suchmaschinentricks.de/aktuelles/blog/579.php">natürliche Verlinkung</a>. Doch genau darauf legen im Übrigen regelmäßig Suchmaschinen-Optimierer zu wenig Gewicht. Ich hatte in letzter Zeit mehrmals mit Aufräumarbeiten zu tun, wo Optimierer die Unternehmens-Website klassisch gut optimiert hatten, aber die natürliche Verlinkung sträflich vernachlässigten. Wer Kunden-Websites optimieren möchte, sollte halt zumindest ab und zu dann doch Matt Cutts lesen.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/news/588.php/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Das Duplicate-Content-Problem</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/blog/521.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/blog/521.php#comments</comments>
		<pubDate>Sun, 05 Mar 2006 23:26:31 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Blog]]></category>
		<category><![CDATA[duplicate content]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[SEO]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/aktuelles/blog/521.php</guid>
		<description><![CDATA[Der Umgang mit &#8211; oder besser: Die Vermeidung von &#8211; Duplicate Content gehört seit längerer Zeit zu den wichtigsten Aufgaben der Suchmaschinen-Optimierung. Vermeidet ein Webmaster doppelte Inhalte, so landet er keinen einzigen Platz weiter oben in den Ergebnislisten, aber er kann einen eventuellen Absturz seiner Listings vermeiden. Ich habe in den vergangenen Monaten etliche Websites [...]]]></description>
			<content:encoded><![CDATA[<p>Der Umgang mit &#8211; oder besser: Die Vermeidung von &#8211; <a href="http://www.suchmaschinentricks.de/lexikon/duplicate-content/">Duplicate Content</a> gehört seit längerer Zeit zu den wichtigsten Aufgaben der Suchmaschinen-Optimierung. Vermeidet ein Webmaster doppelte Inhalte, so landet er keinen einzigen Platz weiter oben in den Ergebnislisten, aber er kann einen eventuellen Absturz seiner Listings vermeiden. Ich habe in den vergangenen Monaten etliche Websites gesehen, bei denen Duplicate Content zugeschlagen hatte und oftmals waren die vorhandenen Doppelungen erst nach längerer Analyse zu erkennen.</p>
<p>Dass Duplicate Content in der Tat ein erhebliches Problem darstellt, macht allein die Ansetzung eines <a href="http://www.seroundtable.com/archives/003398.html ">eigenen Panels</a> im Rahmen der New Yorker <a href="http://www.jupiterevents.com/">Search Engines Strategies Conference</a> (SES) zu diesem Thema deutlich. Zwei Vertreter von großen Suchmaschinen &#8211; Rajat Mukherjee von Yahoo und Matt Cutts von Google &#8211; gestanden denn auch ein, dass Suchmaschinen hier ein Problem haben. &#8220;Wir wollen keine Inhalte abwerten, sondern die richtigen Inhalte nach vorne bringen,&#8221; erklärte Mukherjee. Da dies aber schwierig sei, empfehle er Doppelungen &#8220;wo immer möglich zu vermeiden&#8221;.</p>
<p>Cutts stellte anschließend klar, dass die etwa durch zwei Top-Level-Domains entstandene Spiegelung &#8220;keine Abstrafung durch Google&#8221; mit sich bringe und auch eine (zusätzliche) Druckversion einer Seite kein Problem darstellt. Meiner Erfahrung nach ist das aber nur die halbe Wahrheit. Denn oft genug sind das nicht die einzigen Vervielfältigungen, denen ein Seiteninhalt unterliegt: Zwei Top-Level-Domains und zu jeder normalen Seite eine (ebenfalls crawlbare) Druckversion ergibt bereits eine Vervierfachung &#8211; ein und der selbe Inhalt ist unter vier verschiedenen URLs zu erreichen. Für gewöhnlich ist dann jede Domain auch noch sowohl mit als auch ohne vorangestelltes www erreichbar, und schon sind wir bei acht Kopien angelangt.</p>
<p>Damit sind aber noch längst nicht alle Möglichkeiten moderner Webtechnologien erschöpft. Stellen Sie sich einen Online-Shop vor: Der Kopfbereich, die Navigation, Einkaufshinweise und der ganze Rattenschwanz an Kontakt-, Impressums- und Sonstwasangaben im Fuß der Seite machen oftmals 90 Prozent des Seiteninhalts aus. Ein anderer Fall, aber ähnlich problematisch sind Sites mit einem hohen Anteil an reinen Fotoseiten. Das kann etwa eine Ferienhausvermietung sein; für jedes Objekt eine eigene Seite, auf der nur das Foto und ein Standardtext erscheint &#8211; auch hier droht die Abstrafung wegen Duplicate Content.</p>
<p>Allein die Tatsache, dass das Thema Duplicate Content im Rahmen einer SES diskutiert wurde, erweckt die Hoffnung, dass die großen Suchmaschinen hier bessere Algorithmen finden, die oftmals sehr sinnvolle Wiederverwendungen von Inhalten auf einer Website gegenüber missbräuchlichem Duplicate Content abzugrenzen.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/blog/521.php/feed</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
	</channel>
</rss>
