Die letzten zwei Tage war ich in München: gestern hat uns Bing in einer dem künftigen Marktanteil angemessenen Atmosphäre in der Allianz-Arena künftige Features und Veränderungen vorgestellt, heute hat Stefan (Dank kräftiger Unterstützung von Bing) mit rund 300 Leuten das 10-jährige Jubiläum von suchmaschinentricks.de gefeiert. Als Forennutzer der ersten Stunde habe ich natürlich gerne zugesagt und zusammen mit Uwe Tippmann von Abakus das Thema Backlink-Bewertung beleuchtet. Da aus dem Publikum der Wunsch der Veröffentlichung der Zahlen und Ideen kam, möchte ich das gerne hier in dem Posting machen.
Mein Vortrag drehte sich um das Thema Linkbewertungsfaktoren und was SEOs daraus machen. Das häufig genutzte Wort „Trust“ hat seinen Ursprung in dem Paper „Combating Web Spam with TrustRank“. Google erklärt dort, wie man auf Basis einer manuell ausgewählten Seed-Liste mit vertrauenswürdigen Seiten Spam erkennen kann. Im Groben wird der Klickabstand zwischen den URLs der Seed-Liste sowie der betreffenden URL ermittelt. Es wird vermutet, dass auf dieser Liste relativ viele Domains mit einer .edu-Top-Level-Domain stehen – dies sind nun mal mit die ältesten und vertrauenswürdigsten Domains im Internet.
Sowie die öffentlichen Informationen. Überraschend viele SEOs verallgemeinern dies nun dahingehend, dass .edu-Domains generell ein hohes Vertrauen bei Google genießen und setzen viel Energie und Geld in die Beschaffung von obskuren Links – Hauptsache, sie kommen von einer .edu-Domain. In unserer Datenbank habe ich 4.824 .edu-Domains gefunden. Die IP-Popularity, also die Anzahl unterschiedlicher IP-Adressen, von denen Links auf diese Domains zeigen, als grober Indikator genommen, offenbart, dass nur 472 dieser Domains eine IP-Pop von über 1.000 haben – das sind weniger als 10%. Oder nochmal etwas deutlicher als Bild:
Als zweites Beispiel habe ich die Zusammensetzung der Backlink-Struktur genommen. Im Patent „Methods and systems for identifying manipulated articles” (US Patent 7,302,645) beschreibt Google, wie die starke Abweichung unterschiedlicher Signale von Normalwerten für die Erkennung von unnatürlichen Backlink-Profilen genutzt werden kann. Eigentlich SEO-Allgemeinwissen und es würde vermutlich auch kein SEO den Ausführungen widersprechen. Schaut man sich dann allerdings ein paar Backlink-Strukturen genauer an, so wird deutlich, dass Ziel und Realität häufig nicht komplett übereinstimmen. Bei diesem Beispiel hat die Domain zwar mehr als 1 Millionen Backlinks – diese kommen aber nur von 11 unterschiedlichen IP-Adresse. Hier sind es zwar nicht ganz so viele Links, aber jeder Link kommt von genau einer Domain. Natürlichkeit ist anders, wie die Basis-Zahlen von spiegel.de hoffentlich verdeutlicht haben.
Uwe hat eine Auswertung eines Backlinksets von 10 Millionen Links gezeigt und dabei interessante Durchschnittswerte präsentiert und damit den zweiten Teil meines Vortrags im Detail fortgeführt. Ich hatte das Gefühl, dass es auch den meisten Teilnehmern gefallen hat und freue mich auf die 20-Jahr-Feier.