Lasst uns also eines ein für alle Mal klarstellen: Es gibt keine "Duplicate Content-Penalty".
Zumindest nicht in der Art und Weise, wie es die meisten User beschreiben, wenn sie darüber sprechen.
Es gibt einige Penalties, die mit dem Konzept zusammenhängen, dass eine Site den gleichen Content hat wie eine andere Site. Wenn ihr beispielsweise Content von anderen Sites unerlaubt übernehmt und diesen wieder veröffentlicht, oder falls ihr Content wiederveröffentlicht ohne Mehrwert hinzuzufügen. Diese Techniken sind in folgendem Auszug aus unseren Richtlinien für Webmaster klar (und als nicht empfehlenswert) beschrieben:
- Erstellen Sie keine doppelten Seiten, Sub-Domains oder Domains, die im Grunde denselben Inhalt haben.
- Vermeiden Sie [...] die Verwendung anderer vorgefertigter Techniken wie z. B. Partnerprogrammen ohne oder mit nur geringem eigenem Inhalt.
- Falls Sie mit Ihrer Website an einem Partnerprogramm teilnehmen, prüfen Sie, ob Ihre Website einen wirklichen Wertgewinn darstellt. Stellen Sie speziellen und relevanten Content bereit, der Nutzer zum Besuch Ihrer Website veranlasst.
- Duplizierter Content auf einer Website ist kein Grund für Maßnahmen gegen diese Website, außer es scheint, dass mit diesem duplizierten Content Nutzer getäuscht bzw. Suchmaschinenergebnisse manipuliert werden sollen. Falls Ihre Website duplizierten Content enthält und Sie nicht den oben beschriebenen Tipps folgen, tun wir unser Bestes, eine Version des Contents in unseren Suchergebnissen anzuzeigen.
Die meisten Suchmaschinen streben ein gewisses Maß an Vielfalt an; sie möchten euch zehn verschiedene Ergebnisse auf einer Ergebnisseite zeigen anstelle von zehn verschiedenen URLs, die alle denselben Content haben. Aus diesem Grund versucht Google Duplikate herauszufiltern, damit Usern so wenig wie möglich redundante Ergebnisse angezeigt werden. Mehr dazu könnt ihr in diesem Blogpost erfahren, der u. a. sagt:
- Wenn wir feststellen, dass Duplicate Content vorliegt, der beispielsweise durch Variationen von URL-Parametern hervorgerufen wird, dann fassen wir diese duplizierten URLs zu einer Gruppe zusammen.
- Wir wählen dann jene URL aus, die als am besten geeignet erscheint, die jeweilige Gruppe in den Suchergebnissen zu vertreten.
- Schließlich werden bestimmte Eigenschaften der URLs aus der Gruppe, wie z. B. die Link-Popularität, vereinigt und auf die im vorigen Schritt ermittelte URL übertragen.
- Bezüglich Schritt 2: Googles Auffassung davon, was die "am besten geeignetste" URL ist, stimmt eventuell nicht mit eurer Auffassung überein. Wenn ihr mehr Kontrolle darüber haben möchtet, ob www.example.com/skates/black/riedell/ oder www.example.com/riedell/skates/black/ in unseren Suchergebnissen angezeigt wird, dann lohnt es sich für euch darüber nachzudenken, wie ihr diese Duplizierung vermindern könnt. Ein Weg uns wissen zu lassen, welche URL ihr bevorzugt, besteht darin, diese in eurer Sitemap anzugeben.
- Bezüglich Schritt 3: Wenn wir nicht in der Lage sind, alle Duplikate einer bestimmten Seite zu identifizieren, dann können wir diese nicht entsprechend zusammenfassen. Dies könnte die Stärke der einzelnen Rankingsignale dieses Contents mindern, da sie über verschiedene URLs aufgeteilt sind.
Es lohnt sich nicht zuletzt auch, die Auswirkungen zu beachten, die Duplizierung auf die Bandbreite eurer Site haben kann. Duplicate Content kann zu ineffizientem Crawling führen: Wenn Googlebot zehn URLs auf eurer Site entdeckt, dann muss er jede dieser URLs crawlen, um herauszufinden, ob sie denselben Content beinhalten (und sie entsprechend, wie oben beschrieben, zusammenzufassen). Je mehr Zeit und Ressourcen Googlebot darauf verwenden muss um duplizierten Content auf mehrfachen URLs zu crawlen, desto weniger Zeit hat er, den Rest eures Contents zu erfassen.
Zusammenfassend: Duplicate Content kann eure Site auf verschiedene Arten beeinflussen; solange ihr jedoch nicht absichtlich Duplizierungen erzeugt, ist es unwahrscheinlich, dass eventuelle unerwünschte Auswirkungen aufgrund einer Penalty entstehen. Dies bedeutet, dass:
- ihr keinen Antrag auf erneute Überprüfung einreichen müsst, wenn ihr unbeabsichtigte Duplikate entfernt habt.
- ihr, falls ihr Webmaster im Anfangsstadium seid, wohl nicht zu viel Energie darauf verwenden müsst, über Duplicate Content besorgt zu sein, da die meisten Suchmaschinen damit umgehen können.
- ihr anderen Webmastern helfen könnt, indem ihr den Mythos der Duplicate Content-Penalties nicht weiter verbreitet! Ihr habt alle Mittel zur Hand, um gegen Duplicate Content vorzugehen. Hier sind einige gute Hinweise um anzufangen.
Post von Susan Moskwa, Webmaster Trends Analyst (Übersetzung von Claudia, Search Quality)

22 Kommentare:
Wie sieht es mit DC in Folge der CMS WordPress aus? Es gibt hier massig doppelte Artikel durch Kategorien, Archive, Tags, etc.
Sollte man diesen DC vermeiden oder erkennt ihn Google?
Alle genannten Beispiele beziehen sich auf denselber Content unter einer Domain. Wie sieht es denn mit demselben Content unter Alias-Domains aus?
Also selber Server, selber Webspace, aber zusätzliche Domain?
@ angelpage
Etwas schwarz/weiß deine Ansicht?
Hier ein Gegenbeispiel: Artikel XYZ eines Blogs handelt vom Thema ABC. Das Thema ABC wurde schon öfters besprochen in diesem Blog und wurde daher in der Kategorie oder unter dem Tag ABC abgespeichert. Ruft der Benutzer nun den Tag ABC auf, bekommt er auch noch die anderen Artikel zu diesem Thema und natürlich den, über den er eingestiegen ist. Dieser wäre aber DC, genauso wie alle anderen Artikel.
Ob das Google (Susan) möchte oder nicht: die Methode zur
Erzeugung des Duplicate Content ist dem Besucher doch völlig egal. Der Besucher sucht nach Alternativen.
Egal, ob dieser Content gutwillig, unabsichtlich, bösartig zur Manipulation des Users oder bösartig unter "unabsichtlich" versteckt ist, - Duplicate Content bremst immer aus, verärgert, nervt.
Zusätzlich aber schädigt er Googles Ansehen, falls Duplicate Content angeboten und nichts dagegen getan wird.
Ob das dann Strafe, Hinweis, Bedeutungsverlust oder "Penalty" genannt wird - der User erwartet auf jeden Fall eine angemessene Gegenreaktion von Google.
Google wäre dumm, das nicht zu beachten.
@michael: nicht der Artikel an sich ist der "Duplicate Content", sondern seine mehrfache Darstellung auf unterschiedlichsten "Seiten", obwohl fast immer ein Verweis aufs Original eigentlich reichen würde ...
Tatsächlich scheint für das gesamte "Web 2.0", nicht nur für viele CMS, Blogsoftware, Social Bookmarks usw. charakteristisch, dass aus wenig Inhalt maschinell ganze Linknetzwerke mit tonnenweise "Duplicate Content" erzeugt werden.
Die einzig wirkliche Ursache kennen wir auch: Werbeplatz.
Programmierer und Webmaster wissen sehr wohl, was sie damit dem User antun.
Nichts ist schlimmer als dann nur die ersten Zeilen des Artikels darzustellen, genau das ist ja die Empfehlung um DC zu vermeiden, genau so verärgere ich aber den User weil er einmal mehr klicken muss und genau so erhöhe ich die Klickrate, Werbefläche, etc.
Die meisten CMS machen das eher aus Usability, es soll einfach mehrere Wege geben um an den Content ranzukommen.
Hier auf blogger.com finde ich es z.B. Schade, das der Artikel nicht auf der Kommentarseite mit dabei steht - wäre wieder DC...
@Miccom
Falls ihr im Falle von Wordpress euren Content nicht anders organisieren könnt, sollte das keine Probleme verursachen. Jedoch ist es natürlich auch hier die eleganteste Lösung, Duplicate Content möglichst zu vermeiden.
Beispielsweise könnt ihr den vollständigen Post nur auf der Post-Seite darstellen und auf anderen Seiten lediglich ein Snippet oder Preview anzeigen. Dadurch könnt ihr sicherstellen, dass die Seite mit dem Post den relevantesten Content enthält, wobei andere Seiten wenigstens Links zu eurem Post beinhalten.
@balu
Falls ihr denselben Content auf einer zusätzlichen Domain anbietet, dann solltet ihr folgende Überlegung anstellen:
- Wollt ihr - eventuell aufgrund aussagekräftiger Domainnamen - beide Domains im Index behalten? Wenn ja, dann wäre es natürlich am elegantesten, die Duplizierung des Content auf beiden Sites aufzuheben. Falls ihr dies jedoch nicht machen wollt, dann wird Googles Algorithmus eine entsprechende Auswahl treffen.
- Falls der Name der zusätzlichen Domain keine allzu wichtige Rolle spielt, dann empfiehlt es sich, einen 301-Umleitung zu der bevorzugten Domain einzurichten. Dadurch akkumuliert ihr für diese Site auch mehr PageRank, und sie wird möglicherweise besser ranken als beispielsweise beide Sites individuell.
@michael
Falls ihr den Artikel zusätzlich zu den Kommentaren auf der Kommentarseite angezeigt haben wollt, dann könnt ihr am Anfang dieser Seite auf den Link "Ursprünglichen Post anzeigen" klicken.
Claudia
@search quality team
wie sieht es mit folgender Sachlage aus. Wir haben eine Domain, die fast 9 Jahre alt ist. Sie deckt das Thema Äpfel ab. Wir haben noch einige andere, die jünger sind, und Themen wie Birnen, Kirschen oder Bananen abdecken.
Seit kurzem haben wir eine neue Website erstellt, welche generell Informationen zu allen Obstsorten bereit hält. Sowohl die Inhalte der bestehenden Websites als auch Inhalte zu neuen Obstsorten sind dort zu finden.
Um Duplicate Content zu vermeiden, wird derzeit die Indizierung der Inhalte für Äpfel nur auf der Apfeldomain per robots erlaubt. Auf der Obstdomain werden die Apfelinhalte zwar angezeigt, aber nicht zum Indizieren frei gegeben. Alle Domains liegen auf dem selben Server.
Ist diese Vorgehensweise korrekt oder gibt es Alternativen. Wenn wir langfristig die Obstdomain stärken wollen, sollten wir dann die Indizierung der Inhalte für die Apfeldomain abschalten und vielleicht nur auf die Hauptseite der Domain beschränken? Oder würde diese die ältere Apfeldomain zu nachhaltig schädigen? Oder sollten wir einfach auf allen Domains alle Inhalte zum Indizieren freigeben und Google entscheiden, welche Seite gelistet wird?
Würde mich über ein paar Tipps freuen.
@heinerle42
In eurem Fall wäre es gut, eine Entscheidung zu treffen, welche URLs für welche Inhalte maßgeblich sein sollen. Wenn ihr eure User langfristig von der speziellen Apfeldomain auf die "allgemeine Obstdomain" führen wollt, dann wäre die eleganteste Lösung, eine 301-Umleitung von der Apfeldomain auf die entsprechenden "Apfel-URLs" der allgemeinen Obstdomain einzurichten. Auf diese Weise kann die Obstdomain noch durch Rankingsignale der Apfeldomain gestärkt werden. Ihr solltet in diesem Fall auch keinerlei Inhalte vom Crawl ausschließen (z.B. per robots.txt) - die URLs der Apfeldomain sollten hier auch weiterhin für Googlebot zugänglich sein, damit er der Umleitung folgen kann.
Claudia
Hello,
Wie wird folgende Problemstellung am besten gelöst. Ich habe eine Domain www.123.ch, www.123.de, www.123.at.
Nun möchte ich natürlich, da ich in ch, de und at Verkaufe auch in den entsprechenden Ländern erkannt werden. Der Inhalt der Seite wird jedoch gleich sein.
Muss ich mit den TLD die Seiten unterscheiden, das diese Pro Land erkannt werden, da der Server für alle 3 Seiten der selbe ist und in CH steht?
Wird dies als Duplicate Content angesehen?
Antwort an Erich und Frage an Google Team:
Lass die fingern weg von De/at/ch spiegeln. Ich habe das auf der Webseite 1000ps entdeckt, die haben unter www.seitenname.de und www.seitenname.at den gleichen Inhalt drauf.
Nun habe ich aufgrund der Quälereien mit den Mediaagenturen auch eine at/Ch spiegeln lassen nämlich http://de.peperita.com (die alte und bestehende Startseite) dazu dann neu die at.peperita.com sowie ch.peperita.com.
Nun was ist passiert? Wir sind komplett rausgeflogen und spielen nun seit drei wochen im nirvana herum. Kein Mensch in diesem Google Verein ist in der Lage, den Leuten eine anständige Info zu geben, wie man das machen darf.
Warum ich mich so aufrege: Es werden gute Seiten einfach gekickt und es schert sich keiner was darum. Google Groups bisher kaum hilfreich, habe jetzt die At und ch per robot txt sperren lassen und weiters eine entfernung in den g Webmastertools gemacht. Antrag auf erneute überprüfung schicke ich momentan täglich, jetzt ist unsere beste Zeit und wir sind immer noch ein Startup und nicht NY Venture finanziert.
Wäre dankbar, wenn da mal jemand darüber schauen könnte, meine Erfahrungen widersprechen einfach den Ausführungen.
... ich frage mich, wofür wir Webmaster tools verwenden, eine Info für fehlerhaftes Verhalten und einen ausbesserungszeitraum zu gewähren wäre wirklich eine lapalie. Na ja außer man heißt BMW, dann ist man nach 4 Tagen wieder drin, obwohl man mit Doorways rumbastelt...
Hi chefkoch,
um das Geo-Targeting in den Webmaster-Tools zu nutzen, solltest du die jeweiligen regionalen Sites in den Webmaster-Tools registrieren (z. B. ch.peperita.com). Wenn du Geo-Targeting verwendest, solltest du auch darauf achten, tatsächlich unterschiedlichen regionalen Content auf den jeweiligen Subdomains anzubieten. Eine komplett identische Kopie der de-Version auf der ch-Subdomain zu platzieren ist dabei jedoch nicht optimal.
Davon abgesehen, hatten wir gelegentlich Fälle, wo Webmaster in den Webmaster-Tools unbeabsichtigt / versehentlich einen Antrag auf Entfernung von URLs gestellt haben. Eine Prüfung, ob dies der Fall ist, bietet sich daher an. (Webmaster-Tools -> Tools -> URLs entfernen)
Ich hoffe, das hilft bereits weiter!
Falls du weitere Fragen has, kannst du deinen Fall gern in unserem Forum für Webmaster schildern, wo dir zahlreiche Webmaster und unsere Google-Guides evtl. weitere Ratschläge geben können.
Grüße,
Sven
Hi Sven,
na endlich und Danke für Dein Feedback, hier die Infos von mir:
Die de. Seite ist mit 42.000 Seiten im Index.
Die At und Ch hab ich nach dem Crash erst auf noindex nofollow stellen lassen, dennoch ist die Seite nach einer Woche noch nicht zurück. at und ch habe ich auch in den Webmastertools gelöscht.
Was ich nicht verstehe ist, dass Google hier im Bereich der Länderseiten mit zweierlei Maß misst, ich kenne mittlerweile 8 Portale, die AT und Ch Spiegel (gleich wie de) online haben und keine Penalty erhalten haben. wir sind um 90 Prozent geflogen.
Letzte Sache: Wie bekomme ich wieder meine power zurück?
Wäre echt dankbar für eine Info - Gruß Thomas
Warum gebt ihr kein Feedback und nur standard antworten raus?
Also mein Kommetar dazu habe ich schon mehrfach aufgeführt, DC ist für meine Seiten wo regelmäßig abgeschrieben wird, ein sehr großes Problem geworden. Zum Chefkoch muss ich sagen, gib doch mal deine Seite bei copyscape.com ein.
Ich merke nichts davon, dass Google mit DC umgehen kann.
Ich bin schon am überlegen andere Wege zu gehen.
Hallo,
sehr interessant euer Beitrag, doch ein Frage habe ich noch.
Ich betreibe einen DVD Shop und habe zur Zeit ca. 3000 verschiedene Filme eingestellt.
Es gibt viele Konkurrenten in meinem Bereich, diese haben ebenfalls die selben DVD eingestellt wie ich, selbstverständlich haben diese dann auch die gleiche DVD Beschreibung wie ich, denn diese steht wie bei fast allen Filmen auf der Rückseite der DVD Cover.
Ich nehme mal an das das dann auch "Doppelter Content" ist oder ?
Ich weiß ihr sagt man soll einen selbstgestalteten Text schreiben, aber nicht bei 3000 DVDs, zumal ich mir diese alle anschauen müsste.
Was ratet ihr mir ?
Danke schonmal
@sexspielfilm
Wenn der Aufwand vertretbar ist, lohnt es sich auf jeden Fall, eigene Produktbeschreibungen zu erstellen. Standard-Beschreibungen wie es sie in zahlreichen Shops gibt sind ein häufiger Grund für Duplicate Content. Natürlich wäre es viel Arbeit, zahlreiche Beschreibungen zu überarbeiten - aber es lohnt sich, um sich von den hunderten anderer Sites zu unterscheiden, welche die gleichen Produkte anbieten. Diese persönliche Note hilft dabei, sich von der Masse abzuheben.
Wenn du die Zeit dafür nicht investieren möchtest, könntest du dich stattdessen auf die Homepage und die Bereiche der Site konzentrieren, die nicht die bloßen Produkt-Beschreibungen enthalten um sicherzustellen, dass es dort einzigartigen Content gibt.
Sven
@Search Quality Team
Danke, das war ne Antwort die mit viel Arbeit verbunden ist, ich werde mir die Mühe machen und hoffe doch das es sich lohnt.
Hallo, ich habe immer wieder viele Probleme mir anderen Seitenbetreibern, die meine komplette Startseite oder Teile kopieren und auf Ihren Seiten veröffentlichen. Viele sind auch nicht einsichtig und nehmen die Texte nicht wieder runter. Könnte hier auch mal meine Seite in einen Filter kommen? Sie hat sehr gute Positionen bei den Suchergebnissen und ich habe sehr viel Arbeit reingesteckt, bei Sperrung wegen DC wäre sie dann ja nicht mehr zu finden. Die Ironie der Geschichte wäre, dass die Texte dann auch keine mehr kopieren würde. Habt Ihr hier einen Tipp? Anwälte mag ich nicht gern einschalten.
Versuch es mal mit bot-trap.de, damit sollte dir in Zukunft viel erspart bleiben... Gruß thomas
Kommentar veröffentlichen