Martin hat in einem Posting ein Thema aufgeworfen, zu dem ich zwar auch schon eine Menge Gerüchte und Vermutungen gehört habe, dem aber nie wirklich nachgegangen bin: Ask.com habe keinen eigenen Index mehr, sondern nutze von Google gecrawlte Daten und gewichte diese mit dem eigenen Algorithmus. Für Ask hätte das den Vorteil, dass der sehr kosten- und zeitintensive Arbeitsschritt der Auswahl geeigneter Seiten und das Crawlen dieser entfällt; Google hält dadurch einen ungefährlichen Konkurrenten am Leben und kann bei den Untersuchungen, die in den kommenden Jahren vermutlich anstehen werden auf den funktionieren Wettbewerb im Suchmarkt verweisen. Auch, dass Ask.com seit langem Arbitrage in einem Maßstab betreiben darf, den Google keinem anderen Werbetreibenden gestattet, spricht nicht gerade gegen die Theorie.
Durchsucht man den Index von Ask nach bestimmten Schlüsselworten (Stefan hat das in einem Kommentar zu Martins Posting angemerkt), so wird schnell deutlich, dass der Index in der Tat aus Google-Daten besteht. Hinweise darauf, dass auch der eigene Crawler Informationen beisteuert, gibt es nicht.
Interessant an der Sache ist nun der Hinweis, dass Google lediglich Seiten aus dem primären Index (wer schon etwas länger dabei ist, wird sich erinnern) an Ask weitergibt. Da die Möglichkeiten, die Anzahl dieser Seiten direkt bei Google abzufragen begrenzt und sehr unstabil sind, könnte sich für die nächste Zeit hier eine sinnvolle Anwendung ergeben. Um dies zu überprüfen, habe ich für 1.000 Domains sowohl bei Google als auch bei Ask.com die Zahl der indexierten Seiten ermittelt und verglichen:
Zwar gibt es eine Reihe von Domains, bei denen das Verhältnis zwischen Seiten aus Google und Ask.com-(Primary)-Index mit meinen Erwartungen übereinstimmt (ciao.de: 38%, kelkoo.de: 17%, mister-wong.de: 5%, shortnews.de: 2%), allerdings auch zahlreiche Domains, die so nicht stimmen können (wikipedia.org: 0,8%, yahoo.com: 0,03%). Hier kann ich mir vorstellen, dass die Zahlen von Google deutlich zu hoch „geraten“ sind, der Vergleich also keinen Sinn macht. Ich werde die Werte von Ask.com über die nächste Zeit regelmäßig beobachten, vielleicht ergibt sich so ein Wert aus den Zahlen.