Nach der gängigen SEO-Theorie gehören Links von externen Domains (Backlinks) zu den wichtigsten Rankingfaktoren. Ziel dieses Beitrages ist es, den Zusammenhang zwischen Sichtbarkeitsindex und Backlinks zu untersuchen.
Fischerländer-Diagramm für 10.000 Domains
In Anlehnung an das Fischerländer-Diagramm (Trust-Efficiency-Diagramm von Stefan Fischerländer) habe ich ein Streudiagramm mit den Werten von 10.000 Domains erstellt, um die Bedeutung des Faktors „Backlinks“ zu analysieren. Ein Streudiagramm verdeutlich die Zusammenhänge besser als die reine Darstellung eines Korrelationskoeffizienten. Dieser ist für viele Menschen erst einmal abstrakt und weniger griffig und wird daher oft falsch interpretiert. In Abweichung zum ursprünglichen Fischerländer-Diagramm habe ich nicht wie Stefan die IP-Pop für die X-Achse verwendet, sonder die Anzahl verlinkender Domains (Domain-Pop). Ob man als Kennzahl für den Trust einer Domain die Domain-Pop oder die IP-Pop verwendet macht keinen großen Unterschied. Die Y-Achse zeigt wie bei Stefan den Sichtbarkeitsindex.
Stichprobenauswahl
Für die Untersuchung wurden nur .de-Domains ausgewählt, um die Einflussfaktoren Geotargeting und Sprache möglichst weitgehend zu eliminieren. Bei den ausgewählten Domains handelt es sich nicht um eine Zufallsauswahl, sondern um die 10.000 de-Domains mit den höchsten Werten im Sichtbarkeitsindex. Die Range reicht von 1.784,6 Punkte (amazon.de) bis 0,47 Punkte (satzentrale.de). Mit dieser Auswahl soll sichergestellt werden, dass die untersuchten Domains über eine gewisse Größe verfügen und ausreichend Daten für eine zuverlässige Analyse vorliegen.
Auswertung des Streudiagramms
In dem Streudiagramm ist sehr deutlich ein Zusammenhang zwischen Domain-Pop und Sichtbarkeitsindex zu erkennen. Tendenziell führt eine größere Anzahl verlinkender Domains zu einer größeren Sichtbarkeit der Domain bei Google. Die Punkte verteilen sich nicht zufällig. Vielmehr bildet sich eine Punktwolke, welche von unten links nach oben rechts verläuft. In dem oberen linken Dreieck des Diagramm findet man hingegen keine Punkte. Um eine bestimmte Sichtbarkeit zu erreichen, muss eine Domain anscheinend über eine ausreichende Domain-Pop verfügen.
Korrelationskoeffizient und Bestimmtheitsmaß
Für die eingezeichnete Trendlinie wurde eine Korrelation von 0,67 errechnet. Die Korrelation kann als gut bezeichnet werden. Das Bestimmtheitsmaß ist R^2=0,45. Das bedeutet, dass 45 Prozent der Streuung des Sichtbarkeitsindex durch die Domain-Pop erklärt werden können.
Weitere Einflussfaktoren auf die Sichtbarkeit
Umgekehrt bedeutet es natürlich auch, dass 55 Prozent der Sichtbarkeit nicht durch die Domain-Pop erklärt werden, was man auch sehr gut an der Streuung der Punkte um die Trendlinie erkennt. Diese Größe erscheint plausibel. So sind neben der externen Verlinkung selbstverständlich auch Einflussfaktoren wie Anzahl indexiertert Seiten, Qualität der On-Page-Optimierung, Qualität der Links, Google Penalties, Nutzersignale usw. verantwortlich.
Die zwei Zonen im Streudiagramm
Während die Zone des oberen linken Dreiecks in dem Chart von keiner der untersuchten Domains erreicht wird, da die Domain-Pop als limitierender Faktor wirkt, ist nach rechts unten jede Position denkbar, da es sich dabei um Abweichungen vom Optimum handelt, die in jeder Kombination möglich sind. So kann eine Domain über einen sehr hohen Domain-Pop-Wert verfügen, aber durch eine geringe Anzahl indexierter Seiten oder eine schlechte On-Page-Optimierung in ihrer Sichtbarkeit limitiert werden. Allerdings findet man bei steigenden Domain-Pop-Werten immer weniger starke Abweichungen vom Optimum. Das mag daran liegen, dass mit steigender Domain-Pop die Domains zunehmend professionell betrieben werden und auch die Suchmaschinenoptimierung eine steigende Qualität besitzt.
Ausreißer im Streudiagramm
Bei der folgenden Grafik habe ich die Punkte in der Grafik mit den dazugehörigen Domainnamen beschriftet. Durch die hohe Anzahl wird die Punktwolke schwarz eingefärbt, aber die Domainnamen der Ausreißer lassen sich gut lesen.
So sieht man, dass Domains wie z.B. ebay.de, idealo,de, chip.de, meinestadt.de, kaufda.de und gedicht-und-spruch.de sich eher am linken oberen Rand der Punktewolke befinden und somit weitestgehend die optimale Sichtbarkeit aus der vorhandenen Domain-Pop generieren.
Am unteren rechten Rand befinden sich hingegen Domains wie mister-wong.de und yigg.de. Sie verfügen über eine sehr geringe Sichtbarkeit im Verhältnis zu ihren Domain-Pop-Werten. Gerade bei diesen beiden Domain kann man davon ausgehen, dass deren Sichtbarkeit durch Google Penalties gedrosselt werden.
Ausblick
Wenn Euch die Darstellung gefallen hat, werde ich in den nächsten Wochen weitere Streudiagramme veröffentlichen. So ist es z.B. interessant zu sehen, welchen Unterschiede es macht, ob man als Trust-Wert die reine Anzahl Links, Host-Pop, Domain-Pop, IP-Pop oder Netzwerk-Pop heranzieht.