<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SuchmaschinenTricks.de &#187; Google</title>
	<atom:link href="http://www.suchmaschinentricks.de/aktuelles/tag/google/feed" rel="self" type="application/rss+xml" />
	<link>http://www.suchmaschinentricks.de</link>
	<description>Das deutsche Suchmaschinen-Magazin.</description>
	<lastBuildDate>Thu, 01 Dec 2011 18:08:26 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Panda-Update in Deutschland</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/google/1360.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/google/1360.php#comments</comments>
		<pubDate>Fri, 12 Aug 2011 15:19:27 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[algorithmus]]></category>
		<category><![CDATA[farmer-update]]></category>
		<category><![CDATA[panda-update]]></category>
		<category><![CDATA[ranking]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[topthema]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1360</guid>
		<description><![CDATA[Seit im Frühjahr Google mit einem großen Update den US-Index und wenig später auch den britischen Index aufgeräumt hat, wurde gerätselt, wann denn das Panda-Update in Deutschland zuschlagen würde. Einem Beitrag im Google-Blog zufolge ist es nun auch hierzulande soweit: Der Panda ist in Deutschland angekommen! Doch wie wirkt sich das Panda-Update bei uns aus? [...]]]></description>
			<content:encoded><![CDATA[<p><img src="/wp-content/themes/smt/images/top-panda.jpg" alt="" align="right" style="margin-left: 5px;"/></p>
<p>Seit im Frühjahr Google mit einem großen Update den US-Index und wenig später auch den britischen Index aufgeräumt hat, wurde gerätselt, wann denn das Panda-Update in Deutschland zuschlagen würde. Einem <a href="http://googlewebmastercentral-de.blogspot.com/2011/08/neuer-algorithmus-fur-hochqualitative.html">Beitrag im Google-Blog</a> zufolge ist es nun auch hierzulande soweit: Der Panda ist in Deutschland angekommen!</p>
<p>Doch wie wirkt sich das Panda-Update bei uns aus? Ich habe einen kleinen Schnellvergleich von vier Preis- bzw. Produktvergleichsseiten durchgeführt. Basis waren vier Sets von jeweils 15 Keywords, zu denen die betrachteten Websites vor Panda auf Platz 1 zu finden waren. In der Tabelle habe ich nun die Situation nach Panda dargestellt:</p>
<table class="intexttable">
<tr>
<th>Website</th>
<th>Anz. Platz 1</th>
<th>Top 10</th>
</tr>
<tr>
<td>idealo.de</td>
<td>13</td>
<td>2</td>
</tr>
<tr>
<td>preisroboter.de</td>
<td>3</td>
<td>12</td>
</tr>
<tr>
<td>ciao.de</td>
<td>1</td>
<td>13</td>
</tr>
<tr>
<td>dooyoo.de</td>
<td>0</td>
<td>15</td>
</tr>
</table>
<p>So konnte Idealo.de von seinen fünfzehn Platz-Eins-Platzierungen dreizehn verteidigen &#8211; und die beiden &#8220;Verlierer&#8221; ranken immer noch in den Top 10. Doch auch die Sites, die von Panda Deutschland erwischt wurden, scheinen nicht so schwer getroffen zu sein wie die Verlierer beim US-Panda. Zwar verlor dooyoo.de für alle untersuchten Keywords Platz eins, rankt aber immer noch für all diese Suchbegriffe in den Top 10. Insgesamt ist von den betrachteten sechzig Rankings nur ein Ranking aus den Top 10 gerutscht.</p>
<p>Bestätigt sich der Trend dieser ersten Schnellmessung, scheint sich Panda in Deutschland anders auszuwirken als im englischsprachigen Raum. Dort war der Anteil der Rankings, die komplett abgestürzt sind, weitaus größer.</p>
<p>Und ganz frisch kommen auch schon die ersten Zahlen von Sistrix rein:<br />
<a href="http://www.sistrix.de/news/996-google-panda-erreicht-deutschland.html">Panda-Verlierer in Deutschland</a></p>
<div id="bildnachweis">Bildnachweis: <a href="http://de.fotolia.com/id/21496781" title="" alt="" rel="nofollow">Anna Velichkovsky</a> &#8211; Fotolia.com</div>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/google/1360.php/feed</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>Farmer-Update: Einige Erklärungsansätze</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/google/1312.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/google/1312.php#comments</comments>
		<pubDate>Tue, 29 Mar 2011 13:35:08 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[algorithmus]]></category>
		<category><![CDATA[farmer-update]]></category>
		<category><![CDATA[ranking]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[topthema]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1312</guid>
		<description><![CDATA[Das Farmer-Update von Google ist derzeit in aller Munde, die Erklärungsansätze sind aber noch recht rar gesät. Einen sehr spannenden Artikel hat dazu Bert Schulzki verfasst. Dort vermutet er, dass vor allem fehlender Brand-Traffic die Ursache fürs Abrutschen etlicher, aber eben bei weitem nicht aller Contentfarmen ist. So sehr mich seine Argumentation überzeugte &#8211; und [...]]]></description>
			<content:encoded><![CDATA[<p>Das Farmer-Update von Google ist derzeit in aller Munde, die Erklärungsansätze sind aber noch recht rar gesät. Einen sehr <a href="http://www.bertschulzki.de/fehlender-brand-traffic-als-ursache-fur-farmer-penalty/">spannenden Artikel</a> hat dazu Bert Schulzki verfasst. Dort vermutet er, dass vor allem fehlender Brand-Traffic die Ursache fürs Abrutschen etlicher, aber eben bei weitem nicht aller Contentfarmen ist. So sehr mich seine Argumentation überzeugte &#8211; und das sollte sie auch, schließlich habe ich vor einem guten Jahr beim <a href="http://www.suchmaschinentricks.de/aktuelles/google/1005.php">Google-Marken-Boost</a> ähnlich argumentiert &#8211; so bin ich inzwischen doch zur Überzeugung gelangt, dass sie in diesem Fall nicht zutreffend ist.</p>
<p><img src="/wp-content/themes/smt/images/top-ernte.jpg" alt="" align="right" style="margin-left: 5px;"/></p>
<p>Denn das Update zielt auf die (oftmals eben nicht vorhandene) inhaltliche Qualität und diese Qualität hat wenig mit Brands zu tun. Wir müssen uns nur einmal erinnern, mit welch spammigen Seiten so manche Online-Ableger von bekannten Printmedien in den letzten Jahren angetreten waren. Das Brand-Update 2009 hatte ja eine ganz andere Zielsetzung: Damals hatte Google offenbar festgestellt, dass viele Nutzer bei der Suche nach generischen Begriffen &#8211; etwa <em>Drucker</em> &#8211; bekannte Brands wie Canon oder Brother vermissten. Für diese Zielsetzung ist die Auswertung des Brandtraffics sinnvoll. Im Farmer-Update geht es hingegen darum, die Seiten vorne anzuzeigen, die bessere Qualität haben. Überlegen wir deshalb einmal, wie diese Qualität algorithmisch  gemessen werden könnte.</p>
<h2>Semantische Analyse</h2>
<p>Auf den ersten Blick naheliegend wäre es, die inhaltliche Qualität eines Textes automatisiert zu bewerten. Doch kann das wirklich funktionieren? Werfen wir dazu einen Blick auf folgenden Pseudo-Ratgeber-Text:<br />
<em><strong>Gartenteich anlegen</strong><br />
Um im eigenen Garten einen Gartenteich anlegen zu können, benötigen wir eine Teichfolie, manchmal auch einfach Teichplane genannt. Viele Heimwerker würden nun hergehen und ein Loch graben, doch wir sparen uns diese Arbeit. Wir schichten einfach einen runden Sandwall auf und legen die Folie hinein. Nun durchlöchern wir unsere Teichfolie, denn das befördert den Sauerstoffaustausch und verhindert die Algenbildung. Wenn wir jetzt noch unseren Tümpel mit Wasser aus dem Schlauch füllen, ist unser selbstgemachter Gartenteich auch schon fertig.</em></p>
<p>Dieser Text ist sprachlich ordentlich geschrieben und setzt sogar einige Synonyme ( für die Freunde der <em>Latent Semantischen Optimierung</em>) ein. Trotzdem ist jedem Menschen klar, dass so nie ein Gartenteich funktionieren würde. Aber kann tatsächlich eine Maschine erkennen, dass der Sandwall dem Wasserdruck nicht standhielte und eine durchlöcherte Folie nicht für bessere Sauerstoffversorgung sorgte? Bis wir soweit sind, dürften noch einige Jahrzehnte vergehen.</p>
<h2>Nutzerverhalten</h2>
<p>Ich habe in einem früheren Artikel bereits die Möglichkeiten, die Google hat, das <a href="http://www.suchmaschinentricks.de/aktuelles/seo/987.php">Nutzerverhalten zu bewerten</a>, einmal dargelegt. Die dort geschilderten Möglichkeiten ließen sich auch einsetzen, um die Qualität von Artikeln auf Contentfarmen zu bewerten. Allerdings ist die Analyse dieser Daten sicherlich nicht so ganz einfach. Wer einen Gartenteich anlegen möchte, wird bei der Recherche meist mehr als nur einen Artikel lesen. Wenn also der Nutzer auf die Ergebnisse eins, zwei und drei geht und dann (von Googles Radar) verschwindet, heißt das, dass eins und zwei schlecht, Artikel drei aber gut war? Oder einfach nur, dass der Nutzer nach dem dritten Artikel bemerkt hat, dass alle wesentlichen Hinweise ähnlich sind und er somit seine Recherche abbrechen kann?</p>
<p>Für so weitreichende Entscheidungen wie sie offensichtlich beim Farmer-Update getroffen wurden, erscheinen mir die Daten des Nutzerverhaltens auf den Google-Suchergebnisseiten zu schwammig zu sein als dass Google diesen Daten alleine vertrauen würde.</p>
<h2>Social Media Signale</h2>
<p>Allerdings ist das Web heute voll von Hinweisen auf das Verhalten von Nutzern &#8211; und Google kann viele davon abgreifen. Denn Nutzer stellen heute mit guten Inhalten alles mögliche an: Sie twittern URLs, sie stellen Artikel in Bookmarking-Dienste wie Mister-Wong ein oder sie teilen sie mit ihren &#8220;Freunden&#8221; auf Facebook.</p>
<p><img src="http://www.suchmaschinentricks.de/wp-content/uploads/2011/03/content-farms-backlinks.png" alt="Tabelle mit Backlink-Daten" title="Anzahl von Backlinks auf ausgewählte Content-Farms" /><br />
<em>Anzahl von Backlinks auf die beispielhaft ausgewählten Content-Farms.</em></p>
<p>Um einen Eindruck davon zu bekommen, ob sich daraus Rankingsignale für unseren Zweck ableiten ließen, habe ich für jeweils drei zufällig ausgewählte Farmer-Verlierer und -Gewinner über Yahoo die Backlinks aus den drei Social-Diensten Twitter, Facebook und Mister-Wong ermittelt und aufgelistet. Mir ist bewusst, dass die Erhebung dieser Zahlen über Yahoo alles andere als zuverlässig ist. Aber ich möchte hier ja auch keinen Beweis antreten, sondern lediglich einen Denkanstoß geben. Und die Zahlen deuten an, dass das Farmer-Update womöglich in diese Richtung gehen könnte.</p>
<p>Ich höre schon den Einwand, dass diese Dinge ja einfach manipuliert werden könnten. Und ja, das ist richtig. Das gibt Matt Cutts im <a href="http://www.wired.com/epicenter/2011/03/the-panda-that-hates-farms/">Wired-Interview</a> explizit zu:</p>
<blockquote><p>But for example, our most recent algorithm does contain signals that can be gamed. If that one were 100 percent transparent, the bad guys would know how to optimize their way back into the rankings.</p></blockquote>
<p>Diese Aussage legt zudem nahe, dass es keine tiefsinnigen semantischen Analysen gibt und auch die Auswertung des Nutzerverhaltens auf den Google-SERPs nicht das zentrale Kriterium ist &#8211; beide Punkte wären nicht so einfach zu manipulieren. Getwitterte und gefacebookte URLs sind hingegen recht einfach zu beeinflussen; auch wenn Google garantiert detailliertere Analysen macht als nur die pure Anzahl an Erwähnungen zu bewerten. So wäre eine erste Verbesserung, nicht die pure Anzahl an <em>Social-Mentions</em> heranzuziehen, sondern diese in Relation zur Anzahl vorhandener (oder in einem bestimmten Zeitraum veröffentlichter) Artikel zu setzen. Ich kann mir jedenfalls gut vorstellen, dass solche Analysen zumindest als Teil der Spam-Signale mit eingeflossen sind. Und wer meint, solch vage Zahlen eignen sich nicht als Ranking-Parameter, der möge nochmals meinen Artikel über <a href="http://www.suchmaschinentricks.de/aktuelles/ranking/1065.php">Spam-Signale und Ranking-Faktoren</a> lesen.</p>
<p>Sobald das Farmer-Update (oder Panda-Update, wie Google es nennt) auch hierzulande angekommen ist, sollten wir uns leichter tun mit einer Analyse. Wenn auch die Geschichte der letzten großen Updates &#8211; Mayday, Brand &#8211; zeigt, dass es uns Google immer schwerer macht, die Änderungen zu durchschauen.</p>
<h3>Weiterer Lesestoff</h3>
<p><a href="http://searchengineland.com/who-lost-in-googles-farmer-algorithm-change-66173">Zusammenstellung der Gewinner und Verlierer</a><br />
<a href="http://googleblog.blogspot.com/2011/02/finding-more-high-quality-sites-in.html">Offizieller Google-Post</a><br />
<a href="http://www.sistrix.de/news/985-algorithmus-nderung-google-sucht-nach-qualit-t.html">Algorithmus-Änderung: Google sucht nach Qualität</a><br />
<a href="http://blog.searchmetrics.com/de/2011/03/02/content-farm-update-movers-shakers-und-ihre-history/">Zahlen zu den Gewinnern und Verlierern</a></p>
<div id="bildnachweis">Bildnachweis: <a href="http://de.fotolia.com/id/12906583" rel="nofollow" alt="">Markus Langer</a> &#8211; Fotolia.com</div>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/google/1312.php/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Gestatten: Die Google Cloaking-API</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/seo/1281.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/seo/1281.php#comments</comments>
		<pubDate>Thu, 09 Dec 2010 09:36:14 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[AJAX]]></category>
		<category><![CDATA[canonical]]></category>
		<category><![CDATA[cloaking]]></category>
		<category><![CDATA[Crawler]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[googlebot]]></category>
		<category><![CDATA[topthema]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1281</guid>
		<description><![CDATA[Seit mehr als einem Jahr bietet Google eine offizielle Cloaking-API an. Überraschenderweise hat das bisher kaum jemand bemerkt. Das könnte auch daran liegen, dass die API den komischen Namen Ajax-Crawling-Protokoll trägt und das klingt nun so gar nicht nach Cloaking. Vermutlich hat Google das so genannt, weil der Webmaster damit seine Ajax-Seiten dem Googlebot zugänglich [...]]]></description>
			<content:encoded><![CDATA[<p><img src="http://www.suchmaschinentricks.de/wp-content/uploads/2010/12/cloaking.jpg" alt="" width="400" height="300" title="Google hält Cloaking für einen billigen Trick"  align="right" />Seit mehr als einem Jahr bietet Google eine offizielle Cloaking-API an. Überraschenderweise hat das bisher kaum jemand bemerkt. Das könnte auch daran liegen, dass die API den komischen Namen <strong>Ajax-Crawling-Protokoll</strong> trägt und das klingt nun so gar nicht nach <a href="http://www.suchmaschinentricks.de/technik/suchmaschinen-cloaking">Cloaking</a>.</p>
<p>Vermutlich hat Google das so genannt, weil der Webmaster damit seine Ajax-Seiten dem Googlebot zugänglich machen kann. Wie das geht, beschreibt Google selber <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=de&amp;answer=174992">recht gut</a>. Grundsätzlich funktioniert Ajax-Crawling ziemlich einfach: Der Webmaster verlinkt auf eine Ajax-URL, die &#8220;#!&#8221; enthält und dahinter die für die Ajax-Darstellung nötigen Parameter. Also z.B. so etwas <code>example.com/#!test</code>. Das Protokoll besagt nun, dass der Googlebot nicht diese URL direkt abrufen soll, sondern erst <code>#!</code> durch <code>?_escaped_fragment_=</code> ersetzt. Damit wird aus unserer URL nun <code>example.com/?_escaped_fragment_=test</code> und diese URL wird dann vom Googlebot gecrawlt &#8211; im Google-Index erscheinen aber nur die URLs mit <em>#!</em>, die _escaped_fragment_-URLs tauchen nirgendwo auf und auch andere Suchmaschinen greifen nicht darauf zu.</p>
<p>Damit nimmt uns Google die Hauptarbeit beim Cloaking ab. Die Schwierigkeit liegt beim Cloaking ja darin, den Googlebot sauber von menschlichen Besuchern zu unterscheiden. Mit Ajax-Crawling stellt Google einen Mechanismus bereit, der genau diese Unterscheidung selber vornimmt. Und da bislang nur Google das Ajax-Crawling unterstützt, sehen andere Suchmaschinen (Stichwort: Yahoo Site Explorer) unsere gecloakten Inhalte nicht. Eine Methode also, die sich wunderbar anbietet, um Links zu verstecken.</p>
<p>Natürlich sagt Google, dass sich die Inhalte von <code>#!</code> und <code>?_escaped_fragment_=</code> nicht unterscheiden sollten. Den genauen Wortlaut des entsprechenden Google-Hinweises gebe ich hier mal als Warnung wider:</p>
<blockquote><p>Es ist wichtig zu beachten, dass die Bereitstellung von AJAX-Anwendungen für Crawler keine Einladung dazu ist, Cloaking zu erleichtern. Aus diesem Grund muss der HTML-Snapshot den gleichen Content enthalten, den der Endnutzer in einem Browser sehen soll.</p></blockquote>
<p>Aber die Zusammenarbeit von Javascript-basierter HTML-Erstellung (Ajax) mit der serverseitigen Erzeugung des HTML-Snapshots ist ja durchaus fehleranfällig; da kann es schon mal sein, dass in der Ajax-Version ein paar externe Links vergessen werden &#8230;</p>
<p>Ich bin jedenfalls gespannt, wie Google künftig damit umgehen wird. Google kennt die Problematik, das zeigt ja schon der oben zitierte FAQ-Eintrag. Aber eine automatische Überprüfung der Inhaltsgleichheit von Ajax- und gecrawlter URL ist nicht so ganz einfach; denn dazu bräuchte Google ja einen Ajax-fähigen Crawler und dann könnten sie sich den ganzen Aufwand mit dem Ajax-Crawling-Protokoll gleich sparen. Und wenn nun noch einige SEOs auf die Idee kommen, das ganze mit dem Canonical-Tag zu kombinieren, so dürfte es für Googles irisches Webspamteam einiges zu tun geben.</p>
<p><em>Natürlich lässt sich Ajax-Crawling auch für den offiziellen Zweck einsetzen, Ajax-Seiten für den Googlebot zugänglich zu machen. Wer sich dafür interessiert, dem möchte ich die nächste Ausgabe der Zeitschrift <a href="http://www.websiteboosting.com/">Website-Boosting</a> ans Herz legen. Dort erscheint ein ausführlicher Artikel von mir über Ajax-Crawling. Die Ausgabe gibt es ab dem 4. Januar 2011 zu kaufen.</em></p>
<div id="bildnachweis">Bildnachweis: <a rel="nofollow" href="http://de.fotolia.com/id/5952522">aberenyi</a> &#8211; Fotolia.com</div>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/seo/1281.php/feed</wfw:commentRss>
		<slash:comments>12</slash:comments>
		</item>
		<item>
		<title>Zehn Jahre Suchmaschinentricks.de</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/intern/1153.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/intern/1153.php#comments</comments>
		<pubDate>Wed, 31 Mar 2010 15:00:16 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Intern]]></category>
		<category><![CDATA[forum]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[jubiläum]]></category>
		<category><![CDATA[Suchmaschinen]]></category>
		<category><![CDATA[topthema]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1153</guid>
		<description><![CDATA[Nun ist es soweit: Suchmaschinentricks.de feiert sein zehnjähriges Jubiläum! Ausgerechnet am 1. April 2000 startete ich diese, damals noch recht kleine Website. Mein Ziel war damals nicht, Aufträge als Suchmaschinenoptimierer zu akquirieren; schließlich wusste ich bis dahin noch nicht, dass es sowas wie Suchmaschinenoptimierer als Berufsbild überhaupt gibt. Ich wollte vielmehr mein aus amerikanischen Foren [...]]]></description>
			<content:encoded><![CDATA[<p>Nun ist es soweit: Suchmaschinentricks.de feiert sein zehnjähriges Jubiläum! Ausgerechnet am 1. April 2000 startete ich diese, damals noch recht kleine Website. Mein Ziel war damals nicht, Aufträge als Suchmaschinenoptimierer zu akquirieren; schließlich wusste ich bis dahin noch nicht, dass es sowas wie Suchmaschinenoptimierer als Berufsbild überhaupt gibt. Ich wollte vielmehr mein aus amerikanischen Foren und eigenen Experimenten angesammeltes Wissen allen Webmastern zur Verfügung stellen, damit das Geheimnis um die Top-Positionen in Altavista oder Fireball nicht länger ein Geheimnis bleibe. Ich hatte also anfangs tatsächlich mehr aufklärerischen Antrieb als ein echtes Geschäftsmodell.</p>
<p><img src="http://www.suchmaschinentricks.de/wp-content/uploads/2010/03/diverse-smt-logos.jpg" alt="Diverse Suchmaschinentricks.de-Logos" title="10 Jahre Suchmaschinentricks.de" width="344" height="199" align="right" /></p>
<p>Natürlich ist das nur die halbe Wahrheit. Natürlich hatte ich ein Geschäftsmodell. Immerhin geht&#8217;s ums Frühjahr 2000, da hatte jede Website ein Geschäftsmodell; dummerweise war das Geschäftsmodell für jede Website das gleiche: Bannerwerbung. Auf dem Höhepunkt der ersten Internetblase wurden ja die IPO-Millionen auf direktem Weg vom Kapital- in den Werbemarkt gepumpt. Das Ergebnis waren TKP-Preise für Standardbanner, die sogar dreistellige DM-Preise erreichten. Entsprechend lautete mein Geschäftsmodell: 100.000 PageViews im Monat mal 50,- DM TKP gleich 5.000,- DM Monatsverdienst. Leider sanken im Jahr 2000 die TKP-Preise schneller als meine Besucherzahlen steigen konnten &#8211; und das, obwohl meine Besucherzahlen rapide stiegen.</p>
<h2>Marktanteile 2000</h2>
<p>Allerdings bewahrheitete sich auch für Suchmaschinentricks.de das alte Web-Motto: <em>If you build it, they will come.</em> Nur wenige Tage nach dem Launch der Website kürte Yahoo Suchmaschinentricks.de zur &#8220;Website der Woche&#8221; in Deutschland. Das hatte zwei Konsequenzen. Erstens war innerhalb eines Tages mein gesamtes monatliches Trafficpaket von immerhin einem Gigabyte verbraucht und zweitens erhielt ich wiederum wenige Tage später meinen ersten Auftrag als Suchmaschinenoptimierer.</p>
<p>Damals konnte man ja wirklich noch von Suchmaschinenoptimierer sprechen; heute müssten wir uns eigentlich Googleoptimierer nennen. Im Frühjahr 2000 hatte Yahoo einen Marktanteil von 26 Prozent, Altavista 10 Prozent. Google kam auf gerade mal 5 Prozent und konnte noch nicht einmal eine deutsche Oberfläche vorweisen. So war denn auch am 18. April die erste News-Meldung auf Suchmaschinentricks.de, dass <a href="http://www.suchmaschinentricks.de/aktuelles/news/10.php">Google nun auch auf deutsch</a> verfügbar sei.</p>
<p>Überraschender als die Tatsache, dass Google im April 2000 noch unbedeutend war, sind aber beim Blick auf die <a href="http://www.suchmaschinentricks.de/aktuelles/date/2000">alten Meldungen</a> die vielen längst verschwundenen und vollkommen zurecht vergessenen &#8220;Next Big Things&#8221;. <a href="http://en.wikipedia.org/wiki/RealNames">RealNames</a> etwa war ein Zwitter aus manueller Suchmaschine und alternativem Domain-Registrar. Kunden konnten dort Suchbegriffe kaufen und so ihre Website diesem Begriff zuordnen. Zunächst sollten Kooperationen mit anderen Suchmaschinen, u.a. mit MSN, entsprechenden Traffic für die Suchwörter bringen, später wollte RealNames gar <a href="http://www.suchmaschinentricks.de/aktuelles/news/75.php">das Domain Name System ablösen</a>. Das eigentlich Verrückte dabei war aber nicht das Konzept von RealNames; der echte Wahnsinn waren die Investoren, die über 130 Millionen Dollar in das Unternehmen investiert hatten.</p>
<h2>Manche Konzepte haben überlebt</h2>
<p>Eine zumindest indirekte Renaissance erlebt derzeit das Konzept von <a href="http://en.wikipedia.org/wiki/DirectHit">DirectHit</a>. DirectHit bediente sich als Suchmaschine des Index von Inktomi und versuchte über das Nutzerverhalten (Stichwort: Bounce Rate) auf der Suchergebnisliste zu erkennen, welche Treffer gut und welche schlecht für die entsprechende Suchanfrage sein könnten. Leider hatte DirectHit zum einen das Pech, ausgerechnet zu einem Zeitpunkt durchstarten zu wollen, als Google seinen Aufstieg begann und viel, viel bessere Treffer als alle anderen Suchmaschinen zeigen konnte. Und andererseits gab es 2000 bereits genügend SEOs, die mit Perl-Scripten bewaffnet DirectHit zu ihren Gunsten zu beeinflussen wussten. So kläglich das Konzept damals scheiterte, heute sind viele Suchmaschinenoptimierer überzeugt, dass Google solche Verhaltensmuster (wenngleich auch viel intelligenter) auf den Suchergebnislisten sehr wohl auswertet und ins Ranking einfließen lässt.</p>
<p>Doch gab es im Jahr 2000 noch einige weitere Namen, die damals Bedeutung hatten und heute verschwunden sind. Mit <em>Fireball</em> und <em>Infoseek</em> existierten zwei eigenständige deutsche Suchmaschinen mit ordentlicher Technologie. Ein Eintrag im <em>Yahoo Webkatalog</em> wurde 2000 für kommerzielle Websites kostenpflichtig. Apropos Yahoo: Die heutige Yahoo-Vermarktungsabteilung hieß damals noch nicht mal Overture, sondern <em>Goto.com</em> und war eine erfolgreiche eigenständige Firma. Und das, was wir heute als Google Groups kennen, war unter <em>Deja News</em> bekannt.</p>
<h2>Geburtstagsparty</h2>
<p>Wo wir gerade beim Thema &#8220;Diskussionen&#8221; sind: Den größten Schub brachte Suchmaschinentricks.de der Start des Forums. Tatsächlich wurde das Forum bald so sehr mit der Website identifiziert, dass schon viele Optimierer nur noch das Forum wahrnahmen und alle anderen Artikel wie auch meine News ignorierten. Aber auf das Forum gehe ich sicherlich in einem anderen Artikel intensiver ein.</p>
<p>Natürlich soll dieser Artikel nicht alles zum zehnjährigen Jubiläum gewesen sein. Für den Sommer plane ich eine Geburtstagsparty in München. Weitere Details gibt&#8217;s hier in Kürze. Und wer den Drang verspürt, als Sponsor für diese Veranstaltung aufzutreten, darf sich gerne bei mir melden.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/intern/1153.php/feed</wfw:commentRss>
		<slash:comments>21</slash:comments>
		</item>
		<item>
		<title>SMX München 2010 &#8211; mein Rückblick</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/konferenzen/1147.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/konferenzen/1147.php#comments</comments>
		<pubDate>Wed, 24 Mar 2010 14:34:23 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Konferenzen]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Keywords]]></category>
		<category><![CDATA[Konferenz]]></category>
		<category><![CDATA[local]]></category>
		<category><![CDATA[lokale suche]]></category>
		<category><![CDATA[Real-Time]]></category>
		<category><![CDATA[SMX]]></category>
		<category><![CDATA[topthema]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1147</guid>
		<description><![CDATA[In diesen Stunden geht die diesjährige SMX München 2010 zuende. Viele hundert Online-Marketer aus verschiedensten Branchen haben sich dazu in der bayerischen Landeshauptstadt zusammengefunden. Das Themenspektrum reichte von grundlegenden SEO-Themen wie Keyword-Recherche und Linkbuilding bis hin zu eher strategischen Sessions über &#8220;Agentursteuerung&#8221; oder &#8220;Konsumpsychologie und Konversionsraten&#8221;. Ich war auf der diesjährigen SMX München mir drei [...]]]></description>
			<content:encoded><![CDATA[<p>In diesen Stunden geht die diesjährige <a href="http://smxmuenchen.de/">SMX München 2010</a> zuende. Viele hundert Online-Marketer aus verschiedensten Branchen haben sich dazu in der bayerischen Landeshauptstadt zusammengefunden. Das Themenspektrum reichte von grundlegenden SEO-Themen wie Keyword-Recherche und Linkbuilding bis hin zu eher strategischen Sessions über &#8220;Agentursteuerung&#8221; oder &#8220;Konsumpsychologie und Konversionsraten&#8221;.</p>
<p>Ich war auf der diesjährigen SMX München mir drei Vorträgen vertreten. So habe ich in der Grundlagen-Reihe zunächst mit Kai Spriestersbach von <a href="http://www.bluesummit.de/">Blue Summit</a> über Keyword-Recherche gesprochen. Gemeinsam mit dem SEO-Strategen <a href="http://www.seo-strategie.de/">Hanns Kronenberg</a> durfte ich dann über die &#8220;Ranking-Faktoren, Chancen und Herausforderungen&#8221; der Lokalen Suche &#8211; also über die Optimierung für Google Maps &#8211; referieren. Überraschend an dieser Session war, dass wir uns mit dem Thema &#8220;Lokale Suche&#8221; gegen die zeitgleich auf der SMX stattfindende letzte Show der legendären <a href="http://www.seofm.com/">Webmasters on the Roof</a> durchsetzen konnten. Unser Raum war so gut gefüllt, dass sogar etliche Zuhörer stehen mussten. Am zweiten Tag schließlich stand das für mich derzeit spannendste Thema &#8220;Realtime Search&#8221; auf der Agenda. Während ich hier anhand einiger Beispiele wie dem Erdbeben auf Haiti oder dem Rauswurf eines DSDS-Teilnehmers (<a href="http://www.tagseoblog.de/">Dank an Martin</a> für seine Unterstützung!) auf die Bedeutung der verschiedenen Realtime-Ansätze einging, stellte Michael Kausch von der Agentur <a href="http://www.vibrio.eu/">vibrio</a> vor, wie sie ein &#8220;Haiti for Enterprise&#8221; erzeugten, als sie die Macht des Webs nutzten, um ihren <a href="http://www.vibrio.eu/blog/?p=1526">ungeliebten Kaffeedienstleister</a> loszuwerden.</p>
<p>Beeindruckt hat mich die Linkbuilding-Session mit <a href="http://www.cemper.com/">Christoph Cemper</a>, der einige spannende Details zum Linkbuilding zu erzählen wusste. So haben zum Beispiel sechs der Top-10 für den Suchbegriff <em>seo</em> einen Backlink von einer google.com-Website. Und für den Suchbegriff <em>zuckerkrankheit</em> sind sogar alle zehn Top-10 von Google aus verlinkt! Hinzu kommt, dass sieben der Top-10 einen Backlink vom IT-Portal heise.de haben &#8211; für den Begriff <em>zuckerkrankheit</em> wohlgemerkt.</p>
<p>Die SMX war von Matthew Finlay (und seinen vielen Helfern) wieder hervorragend organisiert, und auch die Party im Münchner &#8220;Vice&#8221; war &#8211; anders als im Vorjahr &#8211; dieser größten deutschen Suchkonferenz würdig. Lediglich das Hotel der SMX München 2010 konnte den Anspruch nicht wirklich erfüllen. Kaffee gab&#8217;s nur in den Pausen, Softgetränke waren hingegen ausschließlich in den Vortragssälen zu finden. Das WLAN hatte viele Aussetzer, war ansonsten lahm, dafür sauteuer. Und es soll Veranstaltungshotels geben, in denen das Personal zumindest die Referententische mit Getränken und Flaschenöffnern bestückt; das Westin Grand in München gehört wohl nicht dazu.</p>
<p>Hier finden Sie die Folien zu meinen oben erwähnten Vorträgen:<br />
<a href='http://www.suchmaschinentricks.de/wp-content/uploads/2010/03/Keyword-Recherche-SMX-2010.pdf'>Keyword-Recherche-SMX-2010</a> (PDF, 542KB)<br />
<a href='http://www.suchmaschinentricks.de/wp-content/uploads/2010/03/Lokale-Suche-SMX-2010.pdf'>Lokale-Suche-SMX-2010</a> (PDF, 608KB)<br />
<a href='http://www.suchmaschinentricks.de/wp-content/uploads/2010/03/Realtime-News-SMX-2010.pdf'>Realtime-News-SMX-2010</a> (PDF, 452KB)</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/konferenzen/1147.php/feed</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Von Spam-Signalen und Ranking-Faktoren</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/ranking/1065.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/ranking/1065.php#comments</comments>
		<pubDate>Mon, 08 Feb 2010 10:25:39 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[ranking]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[PageRank]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[Spam]]></category>
		<category><![CDATA[topthema]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1065</guid>
		<description><![CDATA[Kaum ein Artikel über aktuelle Google-Rankingverfahren oder -Filter kommt inzwischen ohne das Wörtchen &#8220;Signal&#8221; aus. Wo noch vor wenigen Jahren von Rankingfaktor oder Rankingkriterium die Rede war, geht&#8217;s heute stets um Signale. Google selbst benutzt den Ausdruck ebenfalls regelmäßig: PageRank (..) is just one of over 200 signals that can affect how your site is [...]]]></description>
			<content:encoded><![CDATA[<p>Kaum ein Artikel über aktuelle Google-Rankingverfahren oder -Filter kommt inzwischen ohne das Wörtchen &#8220;Signal&#8221; aus. Wo noch vor wenigen Jahren von Rankingfaktor oder Rankingkriterium die Rede war, geht&#8217;s heute stets um Signale. Google selbst benutzt den Ausdruck ebenfalls regelmäßig:</p>
<blockquote><p>PageRank (..) is just one of over 200 signals that can affect how your site is crawled, indexed and ranked</p></blockquote>
<p><img src="/wp-content/themes/smt/images/top-mathe.jpg" alt="Illustration: Mathematik" align="right" /></p>
<p>Was aber ist mit Signal gemeint? Google wendet sich damit gegen das verbreitete Schwarz-Weiß-Denken: Eine Seite hat viele Footer-Links, also ist sie Spam. Eine Seite hat sehr hohen Trust, also kann sie kein Spam sein. Vielmehr geht es darum, eine Vielzahl von Hinweisen oder Merkmalen &#8211; Signale eben &#8211; auszuwerten und fürs Ranking zu benutzen. In gewisser Weise sind Signale nichts anderes als &#8220;weiche&#8221; Rankingfaktoren: Sie können einen Einfluss haben, müssen aber nicht. Erst wenn mehrere Signale zusammenwirken, hat das Einfluss auf die Position der bewerteten Seite. Insbesondere wenn&#8217;s um die Spamerkennung geht, sind Signale für Google wichtig. Ein böser Link alleine führt kaum zu einer Abwertung. Erst wenn Google sieht, dass viele böse Links vorhanden sind, aber wenige gute, kann das Auswirkungen haben.</p>
<p>Dabei ist der Umgang mit Signalen nichts, was Google erfunden hätte. Das grundlegende Vorgehen wird seit Jahren in E-Mail-Spamfiltern angewendet. In einer ansonsten tadellosen E-Mail wird das einmalige Vorkommen von &#8220;viagra&#8221; nicht zur Bewertung als Spam führen. Kommen aber zum Signal &#8220;viagra&#8221; noch weitere Signale (eine zweifelhafte Absender-IP, weitere böse Wörter usw.) hinzu, wird der Spamfilter die E-Mail irgendwann als Spam deklarieren.</p>
<p>Übertragen wir doch dieses Vorgehen einmal auf die Spamerkennung von Suchmaschinen. Wo E-Mail-Filter mit bösen Wörtern hantieren, muss sich der Google-Algorithmus mit Spamsignalen herumschlagen. Dazu könnten Signale gehören wie &#8220;Zu viele böse Backlinks&#8221;, &#8220;Zu hohe Keyword-Dichte&#8221; oder &#8220;Zu viele externe Footer-Links&#8221;. Wir nennen diese drei Kriterien k<sub>1</sub>, k<sub>2</sub> und k<sub>3</sub>. Alle Kriterien gemeinsam bezeichnen wir als K. (In Wirklichkeit gibt es natürlich viel mehr als nur drei solcher Signale, ich möchte das ganze hier aber relativ einfach halten.)</p>
<p>Nun haben die Google-Anti-Spam-Mitarbeiter fleißig hunderttausende von bösen und guten Seiten untersucht, entsprechend eingeteilt und dabei folgende Wahrscheinlichkeiten festgestellt:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=\begin{matrix}k_i%26%20Ham%20%26%20Spam%20\\%20boese%20Backlinks%20%26%200.1%20%26%200.8%20\\%20hohe%20KW-Dichte%20%26%200.2%20%26%200.6%20\\%20viele%20Footer-Links%20%26%200.6%20%26%200.9\end{matrix}" alt="Tabelle der Spam-Signale" /></p>
<p>Die Tabelle sagt aus, dass lediglich auf 10 Prozent der guten Seiten (&#8220;Ham&#8221;) zu viele böse Backlinks gefunden wurden, aber auf 80 Prozent der bösen Seiten (&#8220;Spam&#8221;). Entsprechendes gilt für die anderen beiden Kriterien. So sehen wir auf einen Blick, dass das Kriterium &#8220;Böse Backlinks&#8221; ein gutes Signal für eine Spamseite ist. Würde Google nun aber eine Regel aufstellen, die sagt: &#8220;Wer zu viele böse Backlinks hat, ist Spam!&#8221;, dann würden zehn Prozent aller guten Seiten fälschlicherweise als Spam deklariert. Eine derart hohe Fehlerrate dürfte Google sicherlich zu hoch sein. Würde Google aber umgekehrt verlangen, dass alle drei Kriterien erfüllt sein müssen, kämen zu viele böse Seiten in den Index.</p>
<h2>Falsche Wahrscheinlichkeiten</h2>
<p>Unser Problem liegt nun darin, dass wir die &#8220;falschen&#8221; Wahrscheinlichkeiten haben. Die obige Tabelle zeigt uns, dass 80% der Spamseiten zu viele böse Backlinks haben. Etwas mathematischer ausgedrückt heißt das:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28k_1|Spam%29%20=%200.8" /><br />
Das liest sich in etwa so: Die Wahrscheinlichkeit, dass das Kriterium k<sub>1</sub> unter der Voraussetzung &#8220;Spam&#8221; erfüllt ist, liegt bei 0.8.</p>
<p>Uns interessiert aber genau die &#8220;umgekehrte&#8221; Wahrscheinlichkeit! Also die Wahrscheinlichkeit, dass eine Seite unter der Voraussetzung K &#8220;Spam&#8221; ist:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|K%29%20=%20?" /><br />
Für diese Umkehrung gibt es (unter bestimmten Voraussetzungen) eine bereits seit dem 18. Jahrhundert bekannte Formel, der berühmte <a href="http://de.wikipedia.org/wiki/Bayestheorem">Satz von Bayes</a>, der dem Bayes-Filter seinen Namen verlieh.</p>
<p><img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|K%29=\frac{P%28K|Spam%29%20\cdot%20P%28Spam%29}{P%28K%29}" /></p>
<p>Was sind nun aber die beiden Wahrscheinlichkeiten P(Spam) und P(K)? P(Spam) gibt an, wie wahrscheinlich es ist, dass eine Seite &#8220;Spam&#8221; ist &#8211; das entspricht also einfach dem Anteil der Spamseiten an allen Seiten im Google-Index. Wir nehmen an, ähnlich wie im klassischen E-Mail-Spamfilter, dass sich gute und böse Seiten die Waage halten, die Spamwahrscheinlichkeit also bei 50 Prozent liegt:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam%29%20=%200.5" /><br />
P(K) hingegen ergibt sich aus der Signal-Tabelle. Da entsprechend unserer Annahme &#8220;Ham&#8221;- und &#8220;Spam&#8221;-Seiten gleichverteilt sind, erhalten wir:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28K%29%20=%200.5 \cdot 0.1 %2B 0.5 \cdot 0.8 = 0.45 " /></p>
<p>Setzen wir nun die Daten ein, ergibt sich diese kleine Rechnung:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|K%29=\frac{0.8%20\cdot%200.5}{0.45}%20\approx%200.89" /></p>
<p>Das Ergebnis überrascht uns noch nicht wirklich. Eine Seite, die zu viele böse Backlinks hat, ist mit einer Wahrscheinlichkeit von 89 Prozent eine Spamseite. Da die obige Tabelle sagt, dass zehn Prozent der guten Seiten böse Backlinks haben, sollten wir eine Spamwahrscheinlichkeit von etwa 90 Prozent erwartet haben. Spannender wird die Rechnerei aber, wenn wir diese Formel auf mehrere Kriterien verallgemeinern. Dazu müssen wir annehmen, dass die einzelnen Kriterien voneinander unabhängig sind. Ist dies der Fall, dürfen wir die Einzelwahrscheinlichkeiten einfach multiplizieren:</p>
<p><img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28K|Spam%29=\prod_{i=1}^N\cdot%20P%28k_i|Spam%29" /></p>
<p>(Diese &#8220;naive&#8221; Annahme, dass die einzelnen Kriterien unabhängig sind, verleiht dem hier vorgestellten Bayes-Filter seinen korrekten Namen &#8220;Naiver Bayes-Filter&#8221;. Naiv ist die Annahme deshalb, weil ein Spammer, der zu viele böse Backlinks setzt, wohl auch eine zu hohe Keyword-Dichte einsetzt und schon sind beide Kriterien nicht mehr statistisch voneinander unabhängig.)</p>
<p>Nach einiger Rechnerei, die z.B. <a href="http://www.math.kit.edu/iag1/~ritterbusch/seite/spam/de">hier</a> genauer aufgeführt ist, erhalten wir diese Formel, in die wir einfach unsere Daten aus der Signaltabelle einsetzen können:</p>
<p><img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|K%29=\frac{P%28k_1|Spam%29\cdot%20...%20\cdot%20P%28k_N|Spam%29}{P%28k_1|Spam%29\cdot%20...%20\cdot%20P%28k_N|Spam%29%20%2B%20P%28k_1|Ham%29\cdot%20...%20\cdot%20P%28k_N|Ham%29}" /></p>
<p>Als erstes rechnen wir mit dieser Formel nochmals zur Kontrolle unsere Spamwahrscheinlichkeit für eine Seite aus, auf der lediglich das Kriterium k<sub>1</sub> (&#8220;Zu viele böse Backlinks&#8221;) erfüllt ist:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|k_1%29=\frac{0.8}{0.8%2B0.1}\approx%2089%" /></p>
<p>Nun betrachten wir die Wahrscheinlichkeit, wenn die ersten beide Kriterien (&#8220;Backlinks&#8221;, &#8220;Keyword-Dichte&#8221;) erfüllt sind:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|k_1\cap%20k_2%29=\frac{0.8*0.6}{0.8*0.6%2B0.1*0.2}\approx%2096%" /><br />
Die Spamwahrscheinlichkeit steigt deutlich an; sicher sind wir nun in einem Bereich, in dem Google auf das Spamming reagieren wird.</p>
<p>Was aber passiert, wenn unsere Seite auch noch Kriterium 3 (&#8220;Footer-Links&#8221;) erfüllt?<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|k_1\cap%20k_2\cap%20k_3%29=\frac{0.8*0.6*0.9}{0.8*0.6*0.9%2B0.1*0.2*0.6}\approx%2097%" /><br />
Hier ändert sich nicht mehr viel. Das hat natürlich damit zu tun, dass das dritte Kriterium zwar auf 90% der Spamseiten zu finden ist, aber auch auf sehr vielen (60%) der guten Seiten &#8211; und damit ist dieses Kriterium wenig unterscheidungskräftig.</p>
<p>Deutlicher wird das Ganze, wenn wir uns ansehen, was bei den beiden Kriterien zwei und drei passiert:<br />
<img src="http://chart.apis.google.com/chart?cht=tx&#038;chf=bg,s,FFFFFF00&#038;chco=223a5e&#038;chl=P%28Spam|k_2\cap%20k_3%29=\frac{0.6*0.9}{0.6*0.9%2B0.2*0.6}\approx%2082%" /><br />
Hier erhalten wir eine Spamwahrscheinlichkeit von lediglich 82 Prozent.</p>
<h2>Fazit</h2>
<p>Aber sollten 82 Prozent nicht gut genug sein, eine Seite abzustrafen? Im Einzelfall mag das womöglich plausibel erscheinen. Aber stellen wir uns mal eine Million Seiten vor, auf denen die beiden Kriterien zwei und drei erfüllt sind. Ein Spamwahrscheinlichkeit von 82 Prozent sagt hier aus, dass 820.000 Seiten tatsächlich Spam sind. Allerdings würden wir 180.000 gute Seiten zu unrecht abwerten &#8211; und das hätte negative Auswirkungen auf unseren Index. Denn Nutzer würden nun gute Seiten nicht mehr finden können.</p>
<p>Umgekehrt heißt das aber auch, dass Seiten, die viele gute Signale haben, locker einige Spam-Signale vertragen, ohne gleich abgewertet zu werden. Wer nun unbekümmert auf seinem neuen, kleinen SEO-Projekt alles nachmacht, was eine Topseite so anstellt, sollte sich nicht wundern, wenn er dafür abgestraft wird. Denn die Topseite retten ihre vielen positiven Signale, während das kleine SEO-Projekt lediglich die negativen Spam-Signale vorweisen kann.</p>
<p>Wichtig an diesem kleinen mathematischen Ausflug sind nicht die Details der Rechnung oder die genauen Ergebnisse. Mir ging es vielmehr darum, an einigen konkreten Beispielen die Wirkungsweise von Spam-Signalen aufzuzeigen. Besonders schön sieht man dies am geringen Einfluss des Signals &#8220;Zu viele Footer-Links&#8221;; dieses Signal kommt zwar auf 90% aller Spamseiten vor, trotzdem hat es kaum Auswirkungen auf die Spameinschätzung unseres Algorithmus.</p>
<p><strong>Hinweis:</strong> <em>Die aufgeführten Spam-Kriterien und ihre Wahrscheinlichkeiten sind pure Fantasie! Ebenso funktioniert der Google-Algorithmus sicherlich anders als hier anhand des Bayes-Filters erklärt. Die Rechnungen dienen lediglich dazu, den mathematischen Sachverhalt anhand einiger konkreter Zahlen zu verdeutlichen.</em></p>
<div id="bildnachweis">Bildnachweis: <a href="http://de.fotolia.com/id/2243365" title="" alt="" rel="nofollow">Sulamith</a> &#8211; Fotolia.com</div>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/ranking/1065.php/feed</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Der Google Marken-Boost &#8211; eine Theorie</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/google/1005.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/google/1005.php#comments</comments>
		<pubDate>Thu, 17 Dec 2009 11:11:46 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[Keywords]]></category>
		<category><![CDATA[ranking]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[topthema]]></category>
		<category><![CDATA[unternehmen]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=1005</guid>
		<description><![CDATA[Seit gestern rauscht es gewaltig in den Twitter-Feeds der SEO-Szene: Google listet urplötzlich Marken zu einschlägigen Begriffen deutlich besser als zuvor. Was seit Monaten im US-Index zu sehen ist, hat Google nun auch in Deutschland eingeführt. Dass diese enorme Änderung ausgerechnet mitten im Weihnachtsgeschäft stattfindet, wird manchem Affiliate gar nicht gefallen. Um zu verstehen, was [...]]]></description>
			<content:encoded><![CDATA[<p><img src="/wp-content/themes/smt/images/top-treppe.jpg" alt="Illustration: Treppe" align="right" />Seit gestern rauscht es gewaltig in den Twitter-Feeds der SEO-Szene: Google listet urplötzlich Marken zu einschlägigen Begriffen deutlich besser als zuvor. Was seit Monaten im US-Index zu sehen ist, hat Google nun auch in Deutschland eingeführt. Dass diese enorme Änderung ausgerechnet mitten im Weihnachtsgeschäft stattfindet, wird manchem Affiliate gar nicht gefallen. Um zu verstehen, was genau passiert ist, hier eine kleine exemplarische Übersicht der Änderungen, zum Teil selbst ermittelt, zum Teil <a href="http://www.sistrix.de/news/917-die-marken-kommen.html">beim Johannes geklaut</a>.</p>
<table class="intexttable">
<tr>
<th colspan="2">handy</th>
</tr>
<tr>
<td>t-mobile.de</td>
<td>+39</td>
</tr>
<tr>
<td>nokia.de</td>
<td>+53</td>
</tr>
<tr>
<td>sonyericsson.com</td>
<td>+83</td>
</tr>
<tr>
<th colspan="2">handys</th>
</tr>
<tr>
<td>t-mobile.de</td>
<td>neu</td>
</tr>
<tr>
<td>vodafone.de</td>
<td>+30</td>
</tr>
<tr>
<td>nokia.de</td>
<td>neu</td>
</tr>
<tr>
<th colspan="2">drucker</th>
</tr>
<tr>
<td>canon.de</td>
<td>neu</td>
</tr>
<tr>
<td>brother.de</td>
<td>neu</td>
</tr>
<tr>
<td>lexmark.de</td>
<td>+10</td>
</tr>
<tr>
<th colspan="2">versicherung</th>
</tr>
<tr>
<td>huk.de</td>
<td>+8</td>
</tr>
</table>
<p>Jetzt ist es zwar schon mal interessant zu sehen, was Google da so auswirft, die für SEO spannende Frage aber ist, wie das zustande kommt. Offensichtlich gibt Google bekannten Marken einen deutlichen Schub nach oben. Das scheint eine willkürliche Entscheidung zu sein &#8211; wobei &#8220;willkürlich&#8221; hier bedeuten soll, dass der eigentliche Google-Algorithmus das nicht hergibt. Vermutlich hat Google in Tests festgestellt, dass die Nutzer für generische Anfragen die Brands erwarten, bisher aber häufig nicht gefunden haben. Aber woher weiß Google, dass beispielsweise nokia.de für <em>handy</em> einen Boost verdient hat, für <em>drucker</em> aber nicht?</p>
<p>Ich habe kürzlich im Artikel <a href="http://www.suchmaschinentricks.de/aktuelles/seo/987.php">&#8220;Wie Google das Nutzerverhalten vielleicht fürs Ranking nutzt&#8221;</a> ein paar Methoden vorgestellt, wie Google aus dem Such- und Klickverhalten der Nutzer lernen kann. Zwei dieser Methode möchte ich nochmals herausgreifen, denn sie eignen sich gut, um den Mechanismus hinter dem aktuellen Brand-Boost zu erklären.</p>
<h3>Frühere Suchsessions</h3>
<p>Google kennt ja den Ablauf ganzer Suchsessions. Da fängt ein Nutzer etwa mit einer Suche nach <em>handy</em> an und klickt auf das eine oder andere Ergebnis. Da er noch nicht zufrieden ist oder auf den angeklickten Seiten Informationen erhalten hat, die ihm eine genauere Suche ermöglichen, sucht er weiter. Nehmen wir an, dass er dabei auf einem Forum landet, in dem ein Beitrag vom Online-Shop auf t-mobile.de schwärmt. Nun sucht er gezielt nach <em>t-mobile</em> und landet auf t-mobile.de.</p>
<p>Die ganze Session sieht also in etwa so aus:</p>
<ul>
<li>Suche: handy</li>
<li>Suche: vertragshandy</li>
<li>Suche: t-mobile</li>
<li>Abschließender Klick: t-mobile.de</li>
</ul>
<p>Was lernt Google daraus, wenn eine derartige Session häufig auftritt? t-mobile.de muss für <em>handy</em> ein guter Treffer sein. Da zudem t-mobile.de ein Brand ist, bekommt t-mobile.de für <em>handy</em> eine entsprechende Aufwertung.</p>
<h3>Kookkurrenzen</h3>
<p>Besonders einfach lässt sich die Zuordnung einer Marke zu einem generischen Begriff über Kookkurrenzen (mehrere Wörter kommen häufig gemeinsam in einer Query vor) ermitteln. Sucht man im Google Keyword Tool nach <em>handy</em>, so zeigt sicht, dass <em>handy</em> häufig zusammen mit einer Marke gesucht wird:</p>
<table class="intexttable">
<tr>
<th colspan="2">Kookkurrenzen für <em>handy</em></th>
</tr>
<tr>
<td>handy nokia</td>
<td>4,0 Mio.</td>
</tr>
<tr>
<td>handy sony ericsson</td>
<td>3,4 Mio.</td>
</tr>
<tr>
<td>handy samsung</td>
<td>2,2 Mio.</td>
</tr>
</table>
<p>Google muss sich also nur ansehen, zusammen mit welchen Marken ein Suchbegriff häufig kombiniert wird, um so zu lernen, für welche Suchbegriffe eine vorhandene Marke einen Boost verdienen könnte. Dieser Mechanismus würde auch erklären, warum für <em>girokonto</em> die Postbank und die Sparkasse plötzlich ganz vorne stehen &#8211; eine Frage, die <a href="http://pip.net/pipxmasupdate">Pip in seinem interessanten Post</a> aufgeworfen hat.</p>
<table class="intexttable">
<tr>
<th colspan="2">Kookkurrenzen für <em>girokonto</em></th>
</tr>
<tr>
<td>girokonto</td>
<td>368.000</td>
</tr>
<tr>
<td>girokonto kostenloses</td>
<td>74.000</td>
</tr>
<tr>
<td>kostenos girokonto</td>
<td>33.100</td>
</tr>
<tr>
<td>girokonto schufa</td>
<td>12.100</td>
</tr>
<tr>
<td>girokonto sparkasse</td>
<td>8.100</td>
</tr>
<tr>
<td>girokonto postbank</td>
<td>5.400</td>
</tr>
<tr>
<td>studenten girokonto</td>
<td>5.400</td>
</tr>
<tr>
<td>zinsen girokonto</td>
<td>5.400</td>
</tr>
<tr>
<td>girokonto kreditkarte</td>
<td>3.600</td>
</tr>
</table>
<p>Natürlich ist das alles nur Theorie, allerdings finde ich die Zahlen recht überzeugend. Vielleicht kann ja mit diesen Thesen der eine oder andere SEO seinen Kunden ein wenig beruhigen. Jedenfalls ist auch mit dieser gravierenden Ranking-Änderung SEO <a href="http://www.seokratie.de/081026/das-ende-von-seo-ist-nah/">beileibe nicht tot</a>, aber der Ansatz muss erst recht weiter gefasst werden. SEO ist mehr als Linkaufbau.</p>
<div id="bildnachweis">Bildnachweis: <a href="http://www.fotolia.com/id/251522" title="stairway" alt="stairway" rel="nofollow">jeancliclac</a> &#8211; Fotolia.com</div>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/google/1005.php/feed</wfw:commentRss>
		<slash:comments>9</slash:comments>
		</item>
		<item>
		<title>Wie Google das Nutzerverhalten vielleicht fürs Ranking nutzt</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/seo/987.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/seo/987.php#comments</comments>
		<pubDate>Mon, 14 Dec 2009 15:04:53 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[patent]]></category>
		<category><![CDATA[ranking]]></category>
		<category><![CDATA[Suchergebnis]]></category>
		<category><![CDATA[topthema]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=987</guid>
		<description><![CDATA[In den letzten Monaten sollte auch dem letzten Zweifler klar geworden sein, dass Google das Nutzerverhalten für sein Ranking auswertet. Der Inhalt von Suchanfragen wird dazu ebenso herangezogen wie das Klickverhalten der Nutzer auf den Suchergebnisseiten. Bevor wir uns der Frage zuwenden, wie das funktioniert, möchte ich erst für die noch immer Zweifelnden einen kurzen [...]]]></description>
			<content:encoded><![CDATA[<p>In den letzten Monaten sollte auch dem letzten Zweifler klar geworden sein, dass Google das Nutzerverhalten für sein Ranking auswertet. Der Inhalt von Suchanfragen wird dazu ebenso herangezogen wie das Klickverhalten der Nutzer auf den Suchergebnisseiten. Bevor wir uns der Frage zuwenden, wie das funktioniert, möchte ich erst für die noch immer Zweifelnden einen kurzen Überblick geben, warum so viel für die These spricht, dass Google tatsächlich Nutzerdaten auswerten.</p>
<h3>Google hat die Nutzerdaten</h3>
<p>Erst kürzlich hat <a href="http://www.suchmaschinentricks.de/aktuelles/google/966.php">Google erklärt, dass personalisierte Suche nun Standard</a> ist und nur per Opt-out abgeschaltet werden kann. Das bedeutet, dass Google von (fast) jedem Nutzer die Suchanfragen und die dazu gehörigen Ergebnisklicks kennt. Und über die diversen anderen Google-Angebote von Google Analytics bis hin zu Doubleclick kann Google sogar noch nachvollziehen, was der Nutzer auf den angeklickten Seiten treibt. An den Daten soll&#8217;s also nicht scheitern.</p>
<h3>Google hat ein Patent auf die Auswertung von Nutzerverhalten</h3>
<p>Am 27. Oktober 2009 bekam Google das Patent <a href="http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&#038;Sect2=HITOFF&#038;u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&#038;r=1&#038;p=1&#038;f=G&#038;l=50&#038;d=PTXT&#038;S1=7,610,282.PN.&#038;OS=pn/7,610,282&#038;RS=PN/7,610,282">&#8220;Rank-adjusted content items&#8221;</a> zugesprochen. Dieses Patent beschreibt ein Verfahren, wie komplette Suchsessions ausgewertet und fürs künftige Ranking benutzt werden.</p>
<h3>Google hat die Nutzung bestätigt</h3>
<p>Zumindest für die Auswahl und das Ranking der Google News-Ergebnisse hat Google bereits bestätigt, dass das Nutzerverhalten eine Rolle spielt.</p>
<blockquote><p>The ranking of these articles will be subject to the same criteria as all sites in Google, whether paid or free. (..) It&#8217;s simply based on the popularity of the content with users and other sites that link to it.</p></blockquote>
<p><em>Quelle: <a href="http://googlenewsblog.blogspot.com/2009/12/update-to-first-click-free.html">Google News Blog: &#8220;Google and paid content&#8221;</a></em></p>
<blockquote><p>I would say another really important signal for us in recent quarters has been the user behavior. Their behavior has become a really helpful signal for us in trying to determine that same trusted quality of a given source.</p></blockquote>
<p><em>Quelle: <a href="http://www.stonetemple.com/articles/interview-josh-cohen.shtml">Josh Cohen Interviewed by Eric Enge</a></em></p>
<p>Warum sollte Google ein derart sinnvolles Rankingkriterium lediglich für Google News nutzen, für die Websuche aber außen vor lassen?</p>
<h2>Das Nutzerverhalten und SEO</h2>
<p>Nachdem nun alle überzeugt sind, dass Google das Nutzerverhalten ins Ranking einfließen lässt, stellt sich die Frage, welche Mechanismen dabei eine Rolle spielen und wie das für die Suchmaschinenoptimierung auszunutzen ist.</p>
<h3>Beliebtheit von Websites</h3>
<p>Für Google am einfachsten umzusetzen ist die Beliebtheit von Websites als Signal fürs Ranking zu verwenden. Sobald auf einer Website Google Analytics oder AdSense eingebunden ist, weiß Google genau, wie viele Besucher und wie viele PageImpressions die Site hat. Für alle anderen Sites kann Google über die Toolbar und alle anderen Extensions, die automatisiert den PageRank abfragen, ebenfalls eine ordentliche Schätzung abgeben. Das ermöglicht Google, die Besuchshäufigkeit einer Website als ein Rankingkriterium zu nutzen.</p>
<h3>Click-Thru-Rate auf ein Ergebnis</h3>
<p>Ebenfalls einfach auszuwerten sind die Klickraten auf ein bestimmtes Suchergebnis. Google kennt ja die durchschnittlichen Klickraten auf ein Ergebnis, abhängig von dessen Position (Platz 1, Platz, 2, etc.) , den umgebenden Suchergebnissen (Steht vor dem Online-Shop die Konkurrenz oder Wikipedia?), dem Suchanfragetyp (Navigational oder Transactional Query?) und der Einblendung von Universal Search Ergebnissen. Wird nun beispielsweise für die Suchanfrage <em>fernseher</em> das Ergebnis auf Position fünf häufiger angeklickt als dies aufgrund der oben genannten Faktoren zu erwarten wäre, so ist das für Google ein Signal, diese Seite künftig besser zu platzieren. Für Ergebnisse, die recht weit hinten stehen und deshalb selten angezeigt werden, ist es möglich, sie vereinzelt weiter vorne anzuzeigen und dann das oben beschriebene Klickverhalten auszuwerten.</p>
<p>Wer nun aber glaubt, er brauche nur ein Klickscript zu schreiben und das auf Google loszulassen, der sollte sich unbedingt Julians Artikel zu den <a href="http://www.seokratie.de/081011/wie-userverhalten-in-die-serps-einfliesst-3-beruehmte-seo-mythen/">Mythen übers Userverhalten</a> durchlesen.</p>
<h3>Einfluss früherer ähnlicher Suchsessions</h3>
<p>Das bereits erwähnte Patent &#8220;Rank-adjusted content items&#8221; funktioniert in etwa so: Google stellt fest, dass Nutzer, die in einer Session nach <em>fernseher</em>, <em>breitbild</em> und <em>lcd-tv</em> gesucht haben, anschließend häufig samsung.de besuchten. Wenn nun Google während einer aktuellen Suchsession sieht, dass ein Nutzer nach <em>tv-gerät</em>, <em>breitbild</em> und <em>lcd-tv</em> sucht, dann geht Google davon aus, dass samsung.de ein sinnvoller Treffer ist &#8211; auch wenn die Suchsessions nicht identisch sind. Letztlich ist das nur eine Erweiterung des zuvor beschriebenen Verfahrens, da hier nun mehr als nur eine Suchanfrage benutzt wird.</p>
<h3>Die Bounce-Rate (Absprungrate)</h3>
<p>Auch die Absprungrate kann als Rankingkriterium benutzt werden. Diese Größe gibt an, wie viele Besucher nur eine einzige Seite dieser Website betrachtet haben. Eine geringe Absprungrate kann als Indiz für eine interessante Website gewertet werden &#8211; aber auch als Hinweis für eine schlechte Usability. Deshalb greift der Ansatz &#8220;hohe Bounce-Rate gleich schlechteres Ranking&#8221; viel zu kurz. Um das Verhalten sinnvoll einfließen zu lassen, muss Google berücksichtigen, was der Nutzer nach der Rückkehr von der angeklickten Seite macht. Geht er auf den nächstplatzierten Treffer und kommt erst nach längerer Zeit wieder auf die Google-Startseite, ist das ein Hinweis darauf, dass dieser nächste Treffer seine Suchanfrage besser bedient hat. Bricht er aber unmittelbar nach der Rückkehr seine Suchsession ab, könnte das heißen, dass der angeklickte Treffer gleich auf der ersten Seite das geliefert hat, was der Nutzer finden wollte.</p>
<h3>Kookkurrenz in Suchanfragen</h3>
<p>Das gleichzeitige Auftreten (Kookkurrenz) von Wörtern in Suchanfragen ist ein deutliches Indiz dafür, dass diese Begriffe etwas miteinander zu tun haben. Typische Beispiele dafür sind etwa <em>nokia handy</em> oder <em>bmw gebrauchtwagen</em>. Stellt Google fest, dass Suchanfragen der Art <em>Marke + Generischer Begriff</em> häufig vorkommen, so kann Google daraus schlussfolgern, dass die Marke zu diesem generischen Begriff gehört und somit eine erhebliche Bedeutung dafür haben kann. <a href="http://www.blogstorm.co.uk/how-search-volume-data-may-be-used-to-determine-brand-authority/">Spekulationen sagen</a>, dass auf diese Weise das Nutzerverhalten ausgenutzt wird, um den bekannten Brand-Boost zu ermitteln.</p>
<h2>Wie groß ist der Einfluss des Nutzerverhaltens?</h2>
<p>Mit Sicherheit nutzt Google alle möglichen Nutzerdaten aus, um damit die Suchergebnisse zu verbessern. Da Google ja auch im internationalen Vergleich viel häufiger genutzt wird als konkurrierende Suchmaschinen, hat Google hier ein Alleinstellungsmerkmal, das keine andere Suchmaschine aufzuweisen vermag. Allerdings bleibt die Frage, wie groß der Einfluss dieser Daten aufs Ranking tatsächlich ist.</p>
<p>Auf der diesjährigen SES gab&#8217;s einen schönen Vortrag über die Klickwahrscheinlichkeit in Abhängigkeit von der Platzierung. Dort wurde am Beispiel der Suchanfrage <em>auto</em> gezeigt, dass mobile.de auf Platz 3 eine höhere Klickwahrscheinlichkeit aufweist als auto.de auf Platz 1 &#8211; während im Normalfall Platz 1 etwa fünfmal so viele Klicks abbekommt wie Platz 3. Trotzdem reicht dieses deutliche Nutzervotum nicht aus, mobile.de auf Platz 1 zu hieven. Ein anderes Beispiel zeigt mir eines meiner Testblogs, das mit einem Keyword weit vorne platziert ist. Der einzige ersichtliche Grund dafür sind einige Kommentare, die ich in anderen Blogs hinterlassen habe, wovon die meisten aber sogar auf Nofollow gesetzt sind.</p>
<p>Als Fazit lässt sich festhalten, dass das Nutzerverhalten einen Einfluss aufs Ranking hat. Allerdings sollte dieser Einfluss nicht überbewertet werden. Denn um allzu simple Manipulationen auszuschließen, kann Google nur grobe Trends erfassen. Deshalb ist auch hier der wohl beste Tipp: Bau&#8217; sinnvolle Websites für die Nutzer und optimiere sie mit Sinn und Verstand.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/seo/987.php/feed</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Gedanken zum Google Datenschutz</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/google/984.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/google/984.php#comments</comments>
		<pubDate>Thu, 10 Dec 2009 16:52:31 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[cookie]]></category>
		<category><![CDATA[datenschutz]]></category>
		<category><![CDATA[personalisierung]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=984</guid>
		<description><![CDATA[Niemand wird bestreiten, dass Google ein gigantischer Datensammler ist. Google kennt die Suchanfragen von 90 Prozent der deutschen Internetnutzer, zusammen mit den angeklickten Ergebnissen. dank Google Analytics, AdSense, DoubleClick, Blogger.com und der Toolbar das weitgehende Surfverhalten nahezu aller deutschen Internet-Nutzer auf mindestens einem Drittel der deutschen Websites &#8211; denn allein Analytics ist ja bereits auf [...]]]></description>
			<content:encoded><![CDATA[<p>Niemand wird bestreiten, dass Google ein gigantischer Datensammler ist. Google kennt</p>
<ul>
<li>die Suchanfragen von 90 Prozent der deutschen Internetnutzer, zusammen mit den angeklickten Ergebnissen.</li>
<li>dank Google Analytics, AdSense, DoubleClick, Blogger.com und der Toolbar das weitgehende Surfverhalten nahezu aller deutschen Internet-Nutzer auf mindestens einem Drittel der deutschen Websites &#8211; denn allein Analytics ist ja bereits auf 13 Prozent aller Websites im Einsatz.</li>
<li>die E-Mails von Millionen GMail-Nutzern.</li>
<li>demnächst das komplette Surfprofil aller Nutzer, die den neuen Google-DNS-Service nutzen.</li>
<li>vermutlich das komplette Nutzerverhalten aller <a href="http://www.suchmaschinentricks.de/aktuelles/google/873.php">ChromeOS</a>-Nutzer.</li>
</ul>
<p>Nun lautet bekanntlich Googles Mantra &#8220;Don&#8217;t be evil!&#8221; und in der Tat gibt es noch keinen Vorfall, der daran ernsthaft zweifeln ließe. Ich nutze ja selbst seit Jahren GMail, manchmal auch Google Analytics und auf meinem Netbook <a href="http://www.suchmaschinentricks.de/aktuelles/google/686.php">Chrome</a> als primären Browser. Zu behaupten, ich wäre besonders paranoid was Google angeht, ist definitiv übertrieben.</p>
<p>Trotzdem finde ich die Datenmenge und -qualität, die Google inzwischen angehäuft hat, beängstigend. Zumal Google das Thema Datenschutz meiner Empfindung nach zuletzt immer stiefmütterlicher behandelt. Dass die <a href="http://www.suchmaschinentricks.de/aktuelles/google/966.php">personalisierte Suche</a> von Google nun per Opt-Out-Verfahren funktioniert, stellt eine neue Dimension dar. Bisher musste sich der Nutzer dazu extra anmelden und so waren die typischen DAUs nicht betroffen. Nun aber wird ein höchst interessantes Nutzerprofil erstellt und sechs Monate gespeichert, ohne dass der normale Durchschnittsnutzer das irgendwo mitbekäme.</p>
<p>Wenn es einen Grundsatz über Datensammlungen gibt, dann wohl diesen:</p>
<blockquote><p>Sind Daten erst einmal erhoben, werden sie früher oder später auch zu Zwecken ausgewertet, die anfangs vehement bestritten wurden.</p></blockquote>
<p>Bei den Providern gibt&#8217;s Verbindungsdaten? Die müssen wir speichern! Bei der LKW-Maut fallen Daten an, mit denen man vielleicht Verbrecher fangen kann? Also müssen wir darauf zugreifen können!</p>
<h2>Was hat das nun mit Google zu tun?</h2>
<p>Ich bin heute über dieses <a href="http://gawker.com/5419271/google-ceo-secrets-are-for-filthy-people">Interview mit Google-Chef Eric Schmidt</a> gestolpert. Dort sagt er, ich übersetze mal kurz, folgendes:</p>
<blockquote><p>Wenn du etwas tust, von dem du nicht möchtest, dass jemand anders es weiß, solltest du es vielleicht gleich gar nicht tun.</p></blockquote>
<p>Mich beunruhigt diese Einstellung ganz ernorm. Der Chef der Firma, die wohl mehr über mich weiß als sonst jemand auf der Welt, sagt mir: Wenn du unschuldig bist, hast du nichts zu verbergen! Was heißt das für Googles künftiges Verhalten zum Datenschutz? Will ich dieser Firma wirklich weiterhin mein Vertrauen für meine Mails (und die meiner Mailpartner) entgegenbringen?</p>
<p>Ich habe den Eindruck, Google macht derzeit einen großen Wandel durch. Lange haben sie es geschafft, trotz ihrer Größe einen sympatischen Anschein zu bewahren. Diese &#8211; im besten Fall &#8211; unbedachte Äußerung ihres Chefs zum Datenschutz oder die Einführung einer <a href="http://www.suchmaschinentricks.de/aktuelles/google/978.php">Suchfunktion ohne ersichtlichen Vorteil</a> für die Nutzer sind aber Hinweise, dass Google auf dem langen Weg zum normalen Großkonzern etliche Schritte vorangekommen ist.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/google/984.php/feed</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>Google Real-Time Search</title>
		<link>http://www.suchmaschinentricks.de/aktuelles/google/978.php</link>
		<comments>http://www.suchmaschinentricks.de/aktuelles/google/978.php#comments</comments>
		<pubDate>Mon, 07 Dec 2009 19:52:45 +0000</pubDate>
		<dc:creator>Stefan</dc:creator>
				<category><![CDATA[Google]]></category>
		<category><![CDATA[Real-Time]]></category>
		<category><![CDATA[SERP]]></category>
		<category><![CDATA[universal search]]></category>

		<guid isPermaLink="false">http://www.suchmaschinentricks.de/?p=978</guid>
		<description><![CDATA[Google hat heute seine Echtzeitsuche &#8211; zu gut neudeutsch: Google Real-Time Search &#8211; vorgestellt. Ähnlich wie man das bisher schon von der Twitter-Suche kennt, werden neu gefundene Inhalte per AJAX in die Suchergebnisseiten eingeblendet. Für interessante Suchanfragen mit einer großen Menge an Ergebnissen heißt das, dass die Treffer nur so durchgejagt werden. Wer&#8217;s mal selbst [...]]]></description>
			<content:encoded><![CDATA[<p>Google hat heute seine Echtzeitsuche &#8211; zu gut neudeutsch: Google Real-Time Search &#8211; vorgestellt. Ähnlich wie man das bisher schon von der Twitter-Suche kennt, werden neu gefundene Inhalte per AJAX in die Suchergebnisseiten eingeblendet. Für interessante Suchanfragen mit einer großen Menge an Ergebnissen heißt das, dass die Treffer nur so durchgejagt werden. Wer&#8217;s mal selbst sehen möchte, hier ein Link auf <a href="http://www.google.com/search?hl=en&#038;esrch=RTSearch&#038;q=obama">Obama</a>.</p>
<p>Wird dieses Feature, wie angekündigt, Anfang nächsten Jahres weltweit eingeführt, bedeutet das, dass in den Suchergebnisseiten wieder Platz für die normalen Webtreffer verloren geht. Schon heute gibt es Queries, bei denen man zwischen Videosuche, Fotosuche, Produktsuche, Blogsuche und Newssuche die gewöhnlichen Webtreffer mit der Lupe suchen muss.</p>
<p>Besonders aber stört mich an der Google Real-Time Suche, dass mir dieser Ergebnisticker ziemlich sinnlos erscheint. Alle zu einem Stichwort erscheinenden Tweets und Blogposts angezeigt zu bekommen, ist ungefähr ähnlich hilfreich wie während eines Fußballspiels sämtliche Unterhaltungen aller Stadionbesucher hören zu können. Klar, wer eine Sozialkunde-Hausarbeit über die Gesprächskultur in Fußballstadien schreibt, würde sowas lieben, aber der typische Nutzer dürfte mit etwas mehr Auswahl besser fahren.</p>
<p>So habe ich jedenfalls den Eindruck, Google macht das nur aus Marketinggründen. Sie müssen halt jetzt Real-Time Seach anbieten, weil Bing das auch angekündigt hat und außerdem drei Analysten irgendwann einmal Twitter als den neuen Google-Konkurrenten bezeichnet haben. Die Relevanz dieser durchscrollenden Ergebnisse für den Nutzer halte ich für recht beschränkt. Das soll nun nicht heißen, dass ich die Idee der Real-Time Suche für unsinnig halten würde. Im Gegenteil, das ist eine sehr spannende Funktion &#8211; allerdings kann mich keiner der bisherigen Ansätze auch nur annähernd begeistern. Von Google hätte ich dazu jedenfalls etwas besseres erwartet.</p>
<p><strong>[Update]</strong><br />
<a href="http://googleblog.blogspot.com/2009/12/relevance-meets-real-time-web.html">Official Google Blog: Relevance meets the real-time web</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.suchmaschinentricks.de/aktuelles/google/978.php/feed</wfw:commentRss>
		<slash:comments>15</slash:comments>
		</item>
	</channel>
</rss>

