Als Duplicate Content (auf Deutsch: Doppelter Inhalt) bezeichnet man das Vorhandensein von gleichen Inhalten auf unterschiedlichen URLs.  Dies stellt insofern ein Problem dar, da individuelle Inhalte jeweils nur über eine URL aufrufbar sein sollten.

Zwar kann das Vorhandensein von Duplicate Content durchaus problematisch für die SEO-Power der Seite sein, doch zieht er wirklich eine Abstrafung durch Google nach sich? Diesen und weiteren Fakten rund um das Thema Duplicate Content wollen wir in diesem Blogartikel auf den Grund gehen.

Wie definiert man Duplicate Content?

Duplicate Content stellt, wie bereits gesagt, Content dar, der über mehrere URLs aufrufbar ist. Hierbei muss man zwischen internem und externem Duplicate Content unterscheiden. Interner doppelter Inhalt tritt ausschließlich auf einer Domain bzw. Subdomain auf und wird häufig durch eine fehlerhafte URL-Struktur erzeugt. Externer doppelter Inhalt kann z.B. auf Websites entstehen, die über mehrere Domains erreichbar sind. In beiden Fällen tritt das Problem auf, dass der Google-Bot vor die Wahl gestellt wird, welche URL für den jeweiligen Inhalt, die Keywords etc. geranked werden sollen. Eine extreme Form des externen Duplicate Content wäre das Veröffentlichen von fremden Inhalten auf einer Domain. Leider häufte sich dieses Phänomen in der Vergangenheit, gegebenenfalls müssen Sie hier juristische Schritte einleiten.

Fast schon harmloser sind dagegen weitere Beispiele für interne doppelte Inhalte, welche sich zumeist mit einem gewissen Arbeitsaufwand lösen lassen. So sind Domains häufig mit „www“ und auch ohne „www“ zu erreichen. Gleiches gilt für die gleichzeitige Erreichbarkeit von Seiten mit „https“ und mit „http“.

Was ist kein Duplicate Content?

Neben den offensichtlichen doppelten Inhalten, gibt es aber auch Content, der zwar im übertragenen Sinn doppelt vorhanden ist, aber keinen Duplicate Content darstellt.

Sind zum Beispiel Inhalte in mehreren Sprachversionen verfügbar, etwa auf Deutsch oder Englisch, so stellt dies, laut Google, keinen Duplicate Content dar. Dennoch sollten die Inhalte über ein hreflang-Tag gekennzeichnet werden, um die Versionen miteinander zu verknüpfen.

Wird Duplicate Content abgestraft?

Die wichtigste Frage rund um dieses Thema lautet wohl: Wird Duplicate Content durch Google abgestraft? Diese Frage kann man mit Nein beantworten! Generell wird doppelter Content seitens Googles nicht mit einem Penalty betragt.

Wie bereits erwähnt, erschwert mehrfach vorhandener Content aber die Indexierung durch die Such-Crawler. Diese werden sich letztlich für eine der Seiten entscheiden und für relevante Keywords ranken. Das kann aber letztlich die falsche Domain betreffen, zudem kann die Ziel-URL für das Ranking auch von Woche zu Woche schwanken. In diesem Fall spricht man auch von Keyword-Kannibalismus. Für Google wird letztlich nicht ersichtlich, welche Seite den relevanten Inhalt für die User zur Verfügung stellt.

Aus diesem Grund kann, und die Betonung muss hier auf „kann“ liegen, es dennoch zu Abstrafungen durch Google kommen. Dies wird aber nur der Fall sein, falls Google eine Absicht zur Irreführung des Nutzers oder Manipulation der Suchmaschine hinter dem Nutzen mehrfach vorhandener Inhalte sieht.

An dem Punkt muss erwähnt werden, dass Duplicate Content neben den Schwierigkeiten in Bezug auf die Indexierung für Google ein Ressourcen-Problem darstellt. So ist der Aufwand an Rechenleistung, der für das Crawlen von mehrfach vorhandenen Seiten verwendet wird, teilweise immens hoch. Letztlich geht es hier für Google um Geld, welches ohne Mehrwert ausgegeben und damit verschwendet wird. Ein weiterer Punkt, weshalb Google auf die Lösung der Probleme drängt.

Wie identifiziert man Duplicate Content?

Zunächst sollte man prüfen, ob vorhandener Duplicate Content eventuell schon für Probleme im Bezug auf die Indexierung sorgt. Dazu bietet sich eine Überprüfung der Keywords an, z.B. in einem Monitoring-Tool. Diese Tools wie etwa die AWR-Cloud, erlauben häufig, die jeweils für das Keyword rankende URL auszulesen.

Treten starke Schwankungen auf, empfiehlt es sich, einen genaueren Blick auf die betreffenden Seiten zu werfen.
Wobei die Schwankungen natürlich auch auf andere Ursachen zurückgeführt werden können. Wie etwa ähnliche Title.

Eine einfache, aber eher umständliche Methode, Duplicate Content zu identifizieren, besteht in der „site:“-Abfrage in Google in Verbindung mit Satzbausteinen.

Dies kann wie folgt aussehen:

Die Google-site-Abfrage hilft bei der Analyse der Seiten-Indexierung.

Quelle: Google

Google spielt Ihnen jetzt alle URLs der Domain „ihredomain.de“ aus, auf denen die Keywords „duplicate content finden“ auftauchen. Sollte man also gezielt nach Textbausteinen suchen, bietet sich diese Methode für einen schnellen Check an.

Mit der neuen Google Search Console und dem Report „Indexabdeckung“ hat man die Möglichkeit, URLs zu prüfen, die Google direkt als Duplikate anderer URLs einschätzt. Ein weiterer Klick zeigt sogar die jeweils dazugehörige „Original-URL“ an.

Sollte ein Tool zur Gesamtbetrachtung eines Rankings zu Verfügung stehen (wie etwa Sistrix), empfiehlt sich ein Blick auf den Verlauf. Hat man unerklärliche Einbrüche zum Beispiel in der Sichtbarkeit? Auch hier lohnt sich ein Blick auf die relevanten Inhalte.

Zur exakten Identifikation der doppelten Inhalte sollte man, insbesondere wenn die Domain einen großen Umfang hat, auf Tools zurückgreifen. Kleinere Seiten können beispielsweise mit Screaming Frog crawlen. Sollten URLs doppelt oder sogar mehrfach auftauchen, müssen diese Seiten genauer betrachtet werden.

Für größere Domains bieten sich Tools wie der Sistrix Optimizer an. Dort erhält man eine genaue Auflistung von möglichen Duplicate-Content-Problemen.

Wie löse ich Duplicate Content-Probleme?

Falls möglich, versucht Google etwaige Probleme mit doppelten Inhalten zunächst von sich aus zu lösen. Soweit es machbar ist, indexiert Google ausschließlich die relevanteste URL und wird diese URL bei weiteren Rankinganpassungen beachten.

Idealerweise sollte eine Domain natürlich aus möglichst viel Unique Content bestehen, was in der Realität häufig aber nicht möglich ist. Daher ist es umso wichtiger, die häufig vorkommenden Fehlerquellen zu lösen.

301-Weiterleitungen setzen

Sobald man URLs identifiziert hat, welche man

  1. nicht benötigen und
  2. doppelte Inhalte erzeugen,

sollte man für diese eine 301-Weiterleitung auf die passende URL setzen. Somit hält man die Struktur möglichst kompakt und kann zudem etwaige Altlasten problemlos beheben.

Canonical-Links nutzen

Sollte die URL, die doppelten Inhalt verursacht, dennoch einen Nutzen für die Seite haben, kann sie via Canonical-Link auf die Original-URL verweisen. Somit wird für den Crawler ein klares Signal gesetzt, welche URL priorisiert in den Index genommen werden soll.

Content individualisieren

Content auf URLs zu individualisieren klingt zwar zunächst banal, kann aber große Auswirkungen auf das Ranking der Domain haben. Man sollte abwägen, ob man die jeweilige Seite wirklich braucht und ob der Aufwand sich dementsprechend lohnt. Anschließend kann Content verfasst werden, der den Nutzern alle relevanten Informationen liefert und den man zudem, im Bezug auf die wichtigen Keywords, optimieren kann. Wie man guten Content verfassen, kann man in unserem Blog nachlesen.

Somit löst man nicht nur das Duplicate Content-Problem, sondern schafft einen klaren Mehrwert für die SEO-Power der gesamten Seiten.

Als Duplicate Content (auf Deutsch: Doppelter Inhalt) bezeichnet man das Vorhandensein von gleichen Inhalten auf unterschiedlichen URLs.  Dies stellt insofern ein Problem dar, da individuelle Inhalte jeweils nur über eine URL aufrufbar sein sollten.

Zwar kann das Vorhandensein von Duplicate Content durchaus problematisch für die SEO-Power der Seite sein, doch zieht er wirklich eine Abstrafung durch Google nach sich? Diesen und weiteren Fakten rund um das Thema Duplicate Content wollen wir in diesem Blogartikel auf den Grund gehen.

Wie definiert man Duplicate Content?

Duplicate Content stellt, wie bereits gesagt, Content dar, der über mehrere URLs aufrufbar ist. Hierbei muss man zwischen internem und externem Duplicate Content unterscheiden. Interner doppelter Inhalt tritt ausschließlich auf einer Domain bzw. Subdomain auf und wird häufig durch eine fehlerhafte URL-Struktur erzeugt. Externer doppelter Inhalt kann z.B. auf Websites entstehen, die über mehrere Domains erreichbar sind. In beiden Fällen tritt das Problem auf, dass der Google-Bot vor die Wahl gestellt wird, welche URL für den jeweiligen Inhalt, die Keywords etc. geranked werden sollen. Eine extreme Form des externen Duplicate Content wäre das Veröffentlichen von fremden Inhalten auf einer Domain. Leider häufte sich dieses Phänomen in der Vergangenheit, gegebenenfalls müssen Sie hier juristische Schritte einleiten.

Fast schon harmloser sind dagegen weitere Beispiele für interne doppelte Inhalte, welche sich zumeist mit einem gewissen Arbeitsaufwand lösen lassen. So sind Domains häufig mit „www“ und auch ohne „www“ zu erreichen. Gleiches gilt für die gleichzeitige Erreichbarkeit von Seiten mit „https“ und mit „http“.

Was ist kein Duplicate Content?

Neben den offensichtlichen doppelten Inhalten, gibt es aber auch Content, der zwar im übertragenen Sinn doppelt vorhanden ist, aber keinen Duplicate Content darstellt.

Sind zum Beispiel Inhalte in mehreren Sprachversionen verfügbar, etwa auf Deutsch oder Englisch, so stellt dies, laut Google, keinen Duplicate Content dar. Dennoch sollten die Inhalte über ein hreflang-Tag gekennzeichnet werden, um die Versionen miteinander zu verknüpfen.

Wird Duplicate Content abgestraft?

Die wichtigste Frage rund um dieses Thema lautet wohl: Wird Duplicate Content durch Google abgestraft? Diese Frage kann man mit Nein beantworten! Generell wird doppelter Content seitens Googles nicht mit einem Penalty betragt.

Wie bereits erwähnt, erschwert mehrfach vorhandener Content aber die Indexierung durch die Such-Crawler. Diese werden sich letztlich für eine der Seiten entscheiden und für relevante Keywords ranken. Das kann aber letztlich die falsche Domain betreffen, zudem kann die Ziel-URL für das Ranking auch von Woche zu Woche schwanken. In diesem Fall spricht man auch von Keyword-Kannibalismus. Für Google wird letztlich nicht ersichtlich, welche Seite den relevanten Inhalt für die User zur Verfügung stellt.

Aus diesem Grund kann, und die Betonung muss hier auf „kann“ liegen, es dennoch zu Abstrafungen durch Google kommen. Dies wird aber nur der Fall sein, falls Google eine Absicht zur Irreführung des Nutzers oder Manipulation der Suchmaschine hinter dem Nutzen mehrfach vorhandener Inhalte sieht.

An dem Punkt muss erwähnt werden, dass Duplicate Content neben den Schwierigkeiten in Bezug auf die Indexierung für Google ein Ressourcen-Problem darstellt. So ist der Aufwand an Rechenleistung, der für das Crawlen von mehrfach vorhandenen Seiten verwendet wird, teilweise immens hoch. Letztlich geht es hier für Google um Geld, welches ohne Mehrwert ausgegeben und damit verschwendet wird. Ein weiterer Punkt, weshalb Google auf die Lösung der Probleme drängt.

Wie identifiziert man Duplicate Content?

Zunächst sollte man prüfen, ob vorhandener Duplicate Content eventuell schon für Probleme im Bezug auf die Indexierung sorgt. Dazu bietet sich eine Überprüfung der Keywords an, z.B. in einem Monitoring-Tool. Diese Tools wie etwa die AWR-Cloud, erlauben häufig, die jeweils für das Keyword rankende URL auszulesen.

Treten starke Schwankungen auf, empfiehlt es sich, einen genaueren Blick auf die betreffenden Seiten zu werfen.
Wobei die Schwankungen natürlich auch auf andere Ursachen zurückgeführt werden können. Wie etwa ähnliche Title.

Eine einfache, aber eher umständliche Methode, Duplicate Content zu identifizieren, besteht in der „site:“-Abfrage in Google in Verbindung mit Satzbausteinen.

Dies kann wie folgt aussehen:

Die Google-site-Abfrage hilft bei der Analyse der Seiten-Indexierung.

Quelle: Google

Google spielt Ihnen jetzt alle URLs der Domain „ihredomain.de“ aus, auf denen die Keywords „duplicate content finden“ auftauchen. Sollte man also gezielt nach Textbausteinen suchen, bietet sich diese Methode für einen schnellen Check an.

Mit der neuen Google Search Console und dem Report „Indexabdeckung“ hat man die Möglichkeit, URLs zu prüfen, die Google direkt als Duplikate anderer URLs einschätzt. Ein weiterer Klick zeigt sogar die jeweils dazugehörige „Original-URL“ an.

Sollte ein Tool zur Gesamtbetrachtung eines Rankings zu Verfügung stehen (wie etwa Sistrix), empfiehlt sich ein Blick auf den Verlauf. Hat man unerklärliche Einbrüche zum Beispiel in der Sichtbarkeit? Auch hier lohnt sich ein Blick auf die relevanten Inhalte.

Zur exakten Identifikation der doppelten Inhalte sollte man, insbesondere wenn die Domain einen großen Umfang hat, auf Tools zurückgreifen. Kleinere Seiten können beispielsweise mit Screaming Frog crawlen. Sollten URLs doppelt oder sogar mehrfach auftauchen, müssen diese Seiten genauer betrachtet werden.

Für größere Domains bieten sich Tools wie der Sistrix Optimizer an. Dort erhält man eine genaue Auflistung von möglichen Duplicate-Content-Problemen.

Wie löse ich Duplicate Content-Probleme?

Falls möglich, versucht Google etwaige Probleme mit doppelten Inhalten zunächst von sich aus zu lösen. Soweit es machbar ist, indexiert Google ausschließlich die relevanteste URL und wird diese URL bei weiteren Rankinganpassungen beachten.

Idealerweise sollte eine Domain natürlich aus möglichst viel Unique Content bestehen, was in der Realität häufig aber nicht möglich ist. Daher ist es umso wichtiger, die häufig vorkommenden Fehlerquellen zu lösen.

301-Weiterleitungen setzen

Sobald man URLs identifiziert hat, welche man

  1. nicht benötigen und
  2. doppelte Inhalte erzeugen,

sollte man für diese eine 301-Weiterleitung auf die passende URL setzen. Somit hält man die Struktur möglichst kompakt und kann zudem etwaige Altlasten problemlos beheben.

Canonical-Links nutzen

Sollte die URL, die doppelten Inhalt verursacht, dennoch einen Nutzen für die Seite haben, kann sie via Canonical-Link auf die Original-URL verweisen. Somit wird für den Crawler ein klares Signal gesetzt, welche URL priorisiert in den Index genommen werden soll.

Content individualisieren

Content auf URLs zu individualisieren klingt zwar zunächst banal, kann aber große Auswirkungen auf das Ranking der Domain haben. Man sollte abwägen, ob man die jeweilige Seite wirklich braucht und ob der Aufwand sich dementsprechend lohnt. Anschließend kann Content verfasst werden, der den Nutzern alle relevanten Informationen liefert und den man zudem, im Bezug auf die wichtigen Keywords, optimieren kann. Wie man guten Content verfassen, kann man in unserem Blog nachlesen.

Somit löst man nicht nur das Duplicate Content-Problem, sondern schafft einen klaren Mehrwert für die SEO-Power der gesamten Seiten.

Über den Autor

Posted by
Die wichtigste Regel im SEO-Bereich? Immer am Ball bleiben! Als Autor unseres Blogs bringe ich Ihnen deshalb den ein oder anderen aktuellen Trick bei, mit dem Sie das Ranking Ihrer Domain pushen!
Hat dir der Beitrag gefallen? Bewerte uns!
[Gesamt: 1 Durchschnitt: 5]