Duplicate Content

Unter Duplicate Content versteht man doppelte Inhalte, die über mehrere URLs erreichbar sind. Dieser Duplicate Content sollte unbedingt vermieden werden. Der Inhalt einer Seite darf immer nur über eine eindeutige URL erreichbar sein. Duplicate Content stellt Google vor das Problem, welche URL in den Rankings angezeigt werden soll und welche positiven Rankingsignale welcher URL zugeordnet werden.

Was ist Duplicate Content?

Unter Duplicate Content (engl. für „doppelter Inhalt“), oft auch als „DC“ abgekürzt, ist das Vorhandensein von identischen Inhalten auf einer oder mehreren Websites zu verstehen. Man unterscheidet zwischen internem Duplicate Content und externem Duplicate Content.

Google hat in den letzten Jahren seine Ansichten zu Duplicate Content leicht angepasst. Während früher jede Form von Duplicate Content als problematisch galt, wird heutzutage insbesondere auf den Mehrwert und die Relevanz für die Nutzer geachtet. Duplicate Inhalte, die sich durch regionale Anpassungen oder spezifische Zielgruppenansprache auszeichnen, können akzeptabel sein, wenn sie wertvolle und einzigartige Informationen bieten.

Interner Duplicate Content kann schon alleine dadurch entstehen, dass identische Inhalte auf der eigenen Website unter mehreren URLs vorhanden ist – zum Beispiel durch die Parameter eines Filters, die in der URL stehen.

Externer Duplicate Content kann auftreten, wenn eine Website in mehreren Sprachversionen verfügbar ist, jedoch mit mehr als einer Sprachversion auf dem gleichen Suchmarkt (z. B. google.de) in den Suchergebnissen auftaucht.

Unterschied: Interner und externer Duplicate Content

Interner Duplicate Content beschränkt sich auf die eigene Domain / Hostnamen.

Externer Duplicate Content ist domainübergreifend, tritt also unter zwei oder mehreren Domains auf.

Beispiel internen Duplicate Contents

Häufig haben z. B. Onlineshops mit internem Duplicate Content zu kämpfen. Oft sind Produkt-Detailseiten auch ohne zugehörige Kategorie- und/oder Produktseite direkt aufrufbar:

  • http://www.onlineshop-domain.com/kategorie/produktseite/produktdetailseite
  • http://www.onlineshop-domain.com/produktdetailseite

Gerne werden diese Inhalte dann von Suchmaschinen indexiert, falls von extern auf beide URLs verlinkt wurde. Inkonsistente bzw. eine nicht einheitliche interne Verlinkung ist ebenfalls ein Grund dafür.

Beispiel externer Duplicate Content

Viele Websites sind über mehrere Domainnamen erreichbar. Daran ist auch nichts verkehrt, solang alle anderen Domainvarianten mittels einer 301-Weiterleitung auf die entsprechende Hauptdomain verweisen.

Ist dem nicht so, gibt es für Google unterschiedliche Domains, welche den gleichen Inhalt bieten. Das erschwert dem Google-Bot die Relevanzbestimmung der unterschiedlichen Seiten und kann für die Website zu Ranking-Problemen führen.

Google versucht, Duplicate Content selbst zu identifizieren und zeigt in den Suchergebnissen die Version, die für die Nutzer am relevantesten ist. Dieser Prozess funktioniert in vielen Fällen gut, kann aber zu Schwankungen in den Rankings führen, wenn Google unsicher ist, welche Version die passendste ist.

Sichtbarkeitsverläufe für 4 Domains, die alle den gleichen Inhalt bieten. Es gibt immer wieder Zeitpunkte an denen Google sich entscheidet eine andere der Domains in den Ergebnissen anzuzeigen. Drei Verläufe wechseln sich ab.
Sichtbarkeitsverläufe für 4 Domains, die alle den gleichen Inhalt bieten. Es gibt immer wieder Zeitpunkte an denen Google sich entscheidet eine andere der Domains in den Ergebnissen anzuzeigen. Drei Verläufe wechseln sich ab.

Augenscheinlich ist die Domain radio-sws.de die gewünschte Hauptdomain. Die Inhalte der Website radio-sws.de sind in identischer Form auf drei weiteren Domains zu finden. So entsteht externer Duplicate Content aufgrund mehrerer Domainnamen einer Website. Google ist sich nicht immer sicher, welche der vier Domains zu den Themen relevant ist und rankt abwechselnd die eine sowie die andere Seite.

Was Duplicate Content nicht ist

Liegt ein Inhalt in mehreren Sprachversionen vor, so wird dies nicht als Duplicate Content gewertet. Auch Zitate oder zitierte Textpassagen werden nicht als Ducplicate Content identifiziert.

Bei der Zitierung von Inhalten sollte jedoch auf die korrekte semantische Auszeichnung im Quelltext geachtet werden:

<blockquote>Hier steht der zitierte Text - <cite>Hier steht der Name des zitierten Autors oder der Quelle</cite></blockquote>

Ist Duplicate Content ein Problem?

Ja! Doppelte Inhalte sind nicht einzigartig und liefern Nutzern keinen Mehrwert. Aus Sicht von Google kann Duplicate Content in einigen wenigen Fällen sogar einem Betrugsversuch gleichkommen, wenn Texte von anderne Webseiten ohne Lizens abgeschrieben werden.

Google hat jedoch klargestellt, dass Duplicate Content nicht automatisch zu Ranking-Strafen führt, es sei denn, er wird in einer Weise eingesetzt, die als manipulierend oder täuschend angesehen wird. Die algorithmischen Lösungen Googles sind inzwischen ausgereifter, was dazu beiträgt, viele Duplicate-Content-Probleme automatisch zu bewältigen.

Google versucht Duplicate-Content-Probleme selbst zu lösen

Google versucht, Duplicate Content selbst zu identifizieren und entscheidet eigenständig, welcher Inhalt am relevantesten für die vom User gestellte Suchanfrage ist – und spielt dieses Ergebnis in den SERPs aus.

Bei der vorangegangenen Indiexierung der Inhalte versucht Google ebenfalls die bestmögliche Version (URL) der doppelten Inhalte zu identifizieren und indexiert nur diese – sofern möglich.

Sind die Rankings und der Traffic einer Website trotz eines bestehenden DC-Problems und schwankender indexierten Seitenzahlen konstant, ist das Duplicate-Content-Problem für die Performance der Website erst einmal nicht bedrohlich.

Die eigene Website auf Duplicate Content überprüfen

Der SISTRIX Optimizer bietet eine automatisierte OnPage-Analyse Deiner Websites und zeigt alle SEO-relevanten Fehler und Hinweise auf. Erläuterungen eines jeden Fehlertyp und konkrete Handlungsanweisungen komplettieren den Einstieg in die OnPage-Optimierung.

Inhalte, die doppelt vorhanden sind, legt der SISTRIX Optimizer detailliert für jede einzelne URL dar.

Fehler aus dem SISTRIX Optimizer, der automatisiert auf Duplicate Content hinweist.
Fehler aus dem SISTRIX Optimizer, der automatisiert auf Duplicate Content hinweist.

In der kostenlosen Testphase der SISTRIX Toolbox hast du Zugang zu allen Toolbox-Modulen – darunter auch zum Optimizer, der deine Webseite unter anderem auf Duplicate Content untersucht. Teste den SISTRIX Optimizer kostenlos in der zweiwöchigen Probephase – ganz ohne versteckte Kosten oder Abo.

Was sagt Google?

Google ist sehr darum bemüht, Seiten mit unterschiedlichen Informationen zu indizieren und anzuzeigen. (...) In den seltenen Fällen, in denen wir annehmen müssen, dass duplizierter Content mit der Absicht angezeigt wird, das Ranking zu manipulieren oder unsere Nutzer zu täuschen, nehmen wir die entsprechenden Korrekturen am Index und Ranking der betreffenden Websites vor. Infolgedessen werden diese Websites unter Umständen in den Suchergebnissen niedriger eingestuft oder sogar aus dem Google-Index entfernt und damit nicht mehr in den Suchergebnissen angezeigt.

Quelle: Google-Search-Console-Hilfe

Unser Google-Fazit

Aus Sicht von Google liefert Duplicate Content Nutzern keinen Mehrwert und kann sogar als Spam eingeordnet werden, wenn Texte einfach von anderen Seiten kopiert werden. Die Duplikate behindern Google im Bestreben, das bestmögliche Ergebnis für den User zu finden. Externer Duplicate Content führt zwar nicht immer und schon gar nicht sofort zu einer Abstrafung durch Google, jedoch kann ein andauerndes DC-Problem nachhaltig der Website schaden.

Aktuelle Entwicklungen zeigen, dass Google in vielen Fällen eine selbstständige Lösung für Duplicate Content findet. Dennoch sollte der Fokus darauf liegen, Nutzern eine klare, strukturierte und wertvolle Erfahrung zu bieten, um langfristig stabile Rankings und eine hohe Sichtbarkeit in den Suchergebnissen sicherzustellen.

Video: Was ist Duplicate Content und warum sollte dieser vermieden werden?

Weitereführende Informationen zu diesem Thema

Google

SISTRIX

Steve Paine