Bei den fast endlos vielen Domains, die im Google-Index auf- und absteigen, gibt es einige Projekte, denen erhöhte Aufmerksamkeit gewiss ist. Sie leisten bereits seit langer Zeit solide SEO-Arbeit, werden häufig als Blaupause für Erfolg herangezogen und stehen stellvertretend für ihre Branche. Für mich treffen diese Kriterien auch auf hrs.de zu.
Als die Domain in der letzten Woche massiv im Sichtbarkeitsindex verloren hat, entsponn sich bei Facebook eine kleine Diskussion zu den möglichen Ursachen. HRS gibt an, eine Umstellung der URL-Struktur vorzunehmen. Auswirkungen auf die Besucher durch Google soll dies angeblich nicht haben. Da es diese Woche erneut einen deutlichen Sichtbarkeitsverlust gab, möchte ich in diesem Blogpost mögliche Ursachen zusammentragen und bewerten. Die interne Umstellung von URLs gilt bislang als eher gefahrlose Operation. Sollte sich das geändert haben?
Status Quo von hrs.de
Für den Start der Analyse habe ich 100.000 Seiten von hrs.de mit dem SISTRIX Optimizer gecrawled. Unser Webcrawler verhält sich in weiten Teilen so, wie der Googlebot und ermöglicht damit einen Blick auf den Status Quo der Webseite. Gruppiert man die gecrawlten Seiten nach dem HTML-Status-Code, ergibt sich folgendes Bild:
Nur rund 11% der erfassten Webseiten liefern einen Status-Code 200 zurück und signalisieren Google damit: alles in Ordnung, bitte nehme meine Inhalte in den Index auf. Bei rund 1% der Seiten kam es zu einem Serverfehler (Status-Code: 503). Mehr als 15% der internen Links verweisen auf nicht mehr existente URLs (Status-Code: 404) und über 70% aller aktuell gesetzter, interner Links sind 301-Weiterleitungen. Bei der Bewertung dieser Zahlen ist wichtig, dass es sich um ein aktuelles Abbild der Seite handelt. Der Crawler fängt auf der Startseite der Domain an und folgt internen Links, die der Webseitenbetreiber selber gesetzt hat. Bei hrs.de erhält der Crawler derzeit aber nur bei etwa jeder 10. Seite auf Anhieb eine Antwort vom Server mit dem Status-Code 200, was so viel bedeutet wie OK, die Anfrage wurde erfolgreich bearbeitet und das Ergebnis der Anfrage wird in der Antwort übertragen. In fast 90 % der Fälle antwortet der Server jedoch, dass sich die Inhalte nicht auf der intern verlinkten URL befinden.
Vertiefend habe ich mir die 301-Weiterleitungen genauer angesehen. In der hier vorkommende Masse sind diese Weiterleitungen höchst ungewöhnlich und unnötig: auf interne Links hat der Webseitenbetreiber immer und sofortigen Einfluss. Es gibt keinen Grund, interne Links nicht direkt auf das richtige Ziel zu setzen. Die meisten der überprüften 301-Weiterleitungen zeigen zum Glück mit nur einem Schritt auf die neue URL des Angebots: vom Hostnamen www.hrs.de wird auf hrs.de (ohne www davor) gewechselt, gleichzeitig wird die URL häufig verkürzt (Beispiel: http://www.hrs.de/hotel/de/nordrhein-westfalen/bonn/ auf http://hrs.de/deutschland/bonn/). Trotzdem kann es auch hier vorkommen, dass eine Weiterleitung auf eine fehlende Zielseite erfolgt (Beispiel: nach der 301-Weiterleitung von http://www.hrs.de/hotels/de/deutschland/essen-nordrhein-westfalen/rheinischer-hof-stadt-gut-hotels-6703.html auf http://hrs.de/deutschland/essen/rheinischer-hof-stadt-gut-hotels.html wird der Crawler mit einem 404 empfangen).
Dauerhaftigkeit indexierter URLs
Ging es bislang um die Auswertung von Daten, die aktuell auf der Domain zu finden sind, schaue ich mir im nächsten Schritt etwas ältere Daten an. Am 01.09.2014 und somit vor der URL-Umstellung hatten wir für hrs.de 27.259 unterschiedliche URLs mit mindestens einem Keyword-Ranking in unserem Keywordset gefunden. Crawle ich diese URLs und folge dabei allen Weiterleitungen, ergibt sich folgendes Bild:
Rund 17% der URLs, die Anfang des Monats noch in Google rankten, liefern jetzt einen Fehlercode 404 (Nicht gefunden) zurück. Google verliert in diesem Fall keine Zeit und entfernt diese Seiten aus den Suchergebnissen. Sichtbar wird das beim Keyword “Hotel Ostsee”: rankte hrs.de lange auf Position 1, ist die Ziel-URL jetzt nicht mehr vorhanden und Google hat die Domain aus den SERPs für dieses Keyword geworfen:
Wirksamkeit eingehender Links
Als letzten Check für die “Webseitengesundheit” von hrs.de habe ich die Verfügbarkeit von Linkzielen überprüft. Aktuell finden wir eingehende Links auf 12.742 unterschiedliche Zielseite innerhalb der Domain hrs.de. Hier die Status-Codes für diese URLs:
Auch hier sind erneut rund 17% der neuen URLs fehlerhaft. Die positiven Effekte von 17 Prozent der eingehenden Links gehen damit verloren.
Fazit
Im Ergebnis lässt sich feststellen, dass die URL-Umstellung von hrs.de fehlerhaft und bislang unvollständig umgesetzt wurde. Sehr viele der internen Links sind defekt, die Zielseiten können nicht gefunden werden. Auch zeigen zahlreiche eingerichtete Weiterleitungen ins Leere. Hinzu kommt, dass wichtige Seitenbestandteile wie die Startseite weiterhin auf dem Hostnamen www.hrs.de betrieben werden. Dass die wichtige HTML-Sitemap noch immer auf die alten URLs verlinkt, kann als symptomatisch angesehen werden.
Trotz dieser augenscheinlichen Fehler ist die Höhe des Sichtbarkeitsverlustes überraschend. Ein Verlust von fast 90% war trotz der Fehler und Versäumnisse nicht zu erwarten. Google listet auch korrekt weitergeleitete Unterseiten nicht auf einer vergleichbaren Positon wie zuvor. Rankte hrs.de für “hotel berlin” vor der Umstellung auf Position 1 oder 2, ist die neue Seite, die korrekt umgeleitet wird und von Google auch indexiert wurde, nicht in den Top-100 zu finden.
Eine mögliche Erklärung lautet, dass Google durch den hohen prozentualen Anteil an Onpage-Fehlern das Vertrauen in die Seite als Gesamtes verloren hat und seine Besucher vor eventuell enttäuschenden Erfahrungen schützen will. Sollte dies der Fall sein, reicht eine Bereinigung der Webseite aus. Eine andere Erklärung könnte sein, dass Google durch die Veränderung des Hostnamens (www.hrs.de auf hrs.de) die Umstellung wie einen Domain-Umzug behandelt und eine entsprechend lange Zeit braucht, damit wichtige (Nutzer)-Signale ebenfalls umziehen. Bislang hat Google Umzüge innerhalb einer Domain allerdings freundlicher behandelt und umgehend die alten Rankings übernommen. Wie schätzt ihr die Situation ein?