Hier haben wir unser altes Beispiel einer Site, die schwedische Süßigkeiten verkauft. Stellt euch vor, dass eure bevorzugte Version der URL so aussieht:
http://www.example.com/product.php?item=swedish-fish

Eure User (und Googlebot) können die Seite jedoch über mehrere verschiedene (und nicht so simple) URLs erreichen. Selbst wenn die wesentlichen Informationen hinter diesen URLs die gleichen sind wie in eurer bevorzugten Version, kann es bei diesen anderen Versionen kleine Abweichungen im Content geben, die beispielsweise durch Sortierungsparameter oder die Kategorienavigation bedingt sind:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
Oder es liegt gänzlich identischer Content vor, der aber verschiedene URLs aufgrund von Tracking-Parametern oder Session-IDs besitzt:http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678

Jetzt könnt ihr einfach einen <link>-Tag hinzufügen, um eure bevorzugte Version zu kennzeichnen:
<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />
Fügt dies in den <head>-Abschnitt eurer URLs mit dem Duplicate Content ein:
http://www.example.com/product.php?item=swedish-fish&category=gummy-candy
http://www.example.com/product.php?item=swedish-fish&trackingid=1234&sessionid=5678
Google wird nun erkennen, dass sich die Duplikate alle auf eine kanonische URL beziehen: http://www.example.com/product.php?item=swedish-fish. Alle weiteren URL-Eigenschaften, wie z. B. PageRank oder ähnliche Signale, werden ebenfalls auf die kanonische URL übertragen.
Dieser Standard kann von jeder Suchmaschine übernommen werden, die eure Site crawlt und indexiert.
Natürlich habt ihr vielleicht noch weitere Fragen. Joachim Kupke, Software-Ingenieur in unserem Indexing-Team, kann euch schon mal einige Antworten geben:
Ist rel="canonical" ein Hinweis oder eine Anweisung?
Es ist ein Hinweis, den wir sehr streng befolgen. In Verbindung mit weiteren Signalen werden wir eure bevorzugte Version in Betracht ziehen, wenn wir die relevanteste Seite zu einer bestimmten Suchanfrage ermitteln.
Kann ich einen relativen Pfad verwenden, um meine kanonische URL zu kennzeichnen, wie z. B. <link rel="canonical" href="product.php?item=swedish-fish" />?
Ja, relative Pfade werden erwartungsgemäß mit dem <link>-Tag unterstützt. Falls ihr einen <base>-Link in eurem Dokument aufgenommen habt, werden alle relativen Pfade anhand der <base>-URL aufgelöst.
Ist es in Ordnung, wenn die kanonische URL keine 100%-ige Kopie der Duplicate Content-URLs ist?
Wir tolerieren gewisse geringe Unterschiede - wenn z. B. die Sortierreihenfolge in einer Tabelle mit Produkten verschieden ist. Ebenso wissen wir, dass wir die kanonische URL und die Duplikate möglicherweise zu verschiedenen Zeitpunkten crawlen, so dass sich der Inhalt gegebenenfalls geringfügig unterscheidet. Dies ist vollkommen in Ordnung.
Was passiert, falls die rel="canonical"-URL einen 404-Fehler liefert?
Wir werden damit fortfahren euren Content zu indexieren und eine Heuristik anwenden, um die kanonische URL zu ermitteln. Wir empfehlen jedoch, für die kanonische URL eine tatsächlich existierende URL zu wählen.
Was passiert, falls die ref="canonical"-URL noch nicht indexiert wurde?
Wie mit allem öffentlich zugänglichem Content sind wir bemüht, eine benannte kanonische URL möglichst schnell zu finden und zu crawlen. Sobald diese indexiert wurde, werden wir den rel="canonical"-Hinweis unmittelbar in Betracht ziehen.
Kann es sich bei der rel="canonical"-URL um eine Weiterleitung handeln?
Ja, ihr könnt eine URL mit Weiterleitung als kanonische URL angeben. Wir werden die Weiterleitung dann wie gewöhnlich verarbeiten und versuchen, die URL zu indexieren.
Was passiert, wenn ich widersprüchliche rel="canonical"-Angaben mache?
Unser Algorithmus ist nachsichtig: Wir können Ketten von kanoischen Angaben folgen, jedoch empfehlen wir, dass ihr eure Links dahingehend updated, dass sie auf eine eindeutige kanonische URL verweisen, um die besten Ergebnisse zu gewährleisten.
Kann dieser Link-Tag dazu verwendet werden, um eine kanonische URL auf einer vollkommen verschiedenen Domain zu benennen?
Nein, um auf eine vollkommen verschiedene Domain zu verweisen, solltet ihr permanente Weiterleitungen (301) verwenden. Wir berücksichtigen momentan Angaben zur kanonischen URL auf Subdomains (also innerhalb einer Domain), aber nicht über verschiedene Domains hinweg. Ihr könnt also z. B. www.example.com vs. example.com vs. help.example.com verwenden, nicht jedoch example.com vs. example-widgets.com.
Klingt super - gibt's schon Beispiele?
Ja - wikia.com hat uns bei unseren Tests unterstützt. So könnt ihr beispielsweise im Quelltext der URL http://starwars.wikia.com/wiki/Nelvana_Limited erkennen, dass eine rel="canonical"-URL angegeben wurde: http://starwars.wikia.com/wiki/Nelvana.
Beide URLs sind fast identisch, mit der Ausnahme, dass die erste URL (also "Nelvana_Limited") eine kurze Nachricht im oberen Bereich enthält. Das ist ein gutes Beispiel für dieses neue Feature. Mittels rel="canonical" wurden die Eigenschaften der beiden URLs konsolidiert und in den Suchergebnissen taucht die von wikia.com bevorzugte Version auf.
Falls ihr weitere Fragen habt, könnt ihr diese gern als Kommentar hinterlassen. Und falls es euch nicht möglich ist, eine kanonische URL in eure Seiten einzubauen: Keine Sorge - davon unabhängig bemühen uns, eure bevorzuge Version im Fall von Duplicate Content zu ermitteln und alle Link-Eigenschaften entsprechend zu übertragen. So, wie wir das schon früher gemacht haben.
Post von Joachim Kupke, Senior Software Engineer, und Maile Ohye, Developer Programs Tech Lead (Übersetzung von Sven, Search Quality)

Kommentare:
Interessantes Feature, und nett, dass Microsoft und Yahoo dies zeitgleich launchen.
Eine Frage habe ich noch:
Darf eine "kanonische" Seite per rel="canonical" auf sich selbst zeigen? - Dies würde im Implementierung in vielen Fällen vereinfachen ...
Gruss,
Bjoern
Das heißt, ich kann "nur" Verzeichnisse kanonisieren, keine einzelnen Seiten?
@petrak: Doch, du kannst einzelne Seiten, kanonisieren, etwa
<link rel="canonical" href="http://domain.de/seite1.html" />
Genauer gesagt können alle URL kanonisiert werden, dies können einzelne Seiten, Verzeichnisse oder sonstwas sein.
Gruss,
Bjoern
interessantes feature... wie B. allerdings bereits bemerkte, wäre es spannend zu wissen, ob die seite, auf die rel="canonical" verweist, selbst auch ein solcher header-eintrag aufweisen darf...
Begeisterung :)
@Bjoern: In dem Nelvana-Beispiel verlinkt die "Originalseite" im "cannonical" auf sich selbst, von daher scheint die Seite das wohl zu dürfen.
Aber eine "offizielle" Aussage darüber wäre sehr nett.
@Christian: Das ist ein Hinweis, vielen Dank!
Vielleicht meldet sich ja auch noch ein offizieller zu Wort. Auf der englischen Seite taucht die Frage ebenfalls auf, allerdings konnt ich dort auch noch keine Antwort ausmachen.
Gruss,
Bjoern
Eine Site - verschiedene URL -> da muss die Seite auf sich selbst verweisen. Oder habe ich da was falsch verstanden
(Bei dem Thema DC krieg ich immer einen Knoten im Hirn ... ;-)
Grüsse
ledzep
@Bjoern
Die URL, auf die mittels rel="canonical" verwiesen wird, kann auch einen entsprechenden Verweis auf sich selbst beinhalten - das ist vollkommen in Ordnung.
Grüße,
Sven
Danke für die "offizielle" Antwort.
Gruss,
Bjoern
Hier sich je interessant an und könnte bei mir auch durchaus Sinn machen, doch wo genau liegt der Unterschied zwischen der neuen Technik und dem alten "noindex" ?
Bzw. bisher werden auch teilweise bei mir Seiten intern einfach umgeleitet per 301 wie bei Wikipedia, ist das nicht besser für die Besucher? Die sehen dann ja immer die gleiche URL und nicht unterschiedliche.
Bei "noindex" wird gar keine Seite indiziert, bei "canonical" wird die angegebene Seite indiziert.
In einigen Fälle mag man auch mit "noindex" zum Ziel kommen, "canonical" ist aber wahrscheinlich einfacher zu verwenden.
Gruss,
Bjoern
Wenn meine URL im base-Link mit einem Slash endet, also so... base href="http://www.example.com/" ... und ich im Canonical-link-Tag einen relativen Pfad verwende der aufgrund technischer Einschränkungen nur mit beginnendem Slash wiedergeben werden kann... link rel="canonical" href="/product.php?item=swedish-fish" ...muss ich dann aus der base-URL den abschließenden Slash entfernen?
@Jens Stork
Von unserer Seite aus sollte es keine Probleme geben, wenn der Slash sowohl am Ende der <base>-URL als auch am Beginn der kanonischen URL steht. Da andere Suchmaschinen das <base>-Element möglicherweise anders behandeln, würde sich in diesem Fall anbieten, absolute Pfade für die kanonischen URLs zu verwenden.
Fall das in deinem Beispiel technisch nicht möglich ist, kannst du auf jeden Fall den Slash am Ende der <base>-URL entfernen - explizit für Google ist das aber gar nicht notwendig.
Grüße,
Sven
Kann ich das auch brauchen, um die jsessionid zu umgehen google webmaster tools reportet mit immer duplicate XY und eine liste mit jsessionids der selben page.
meine page ist http://www.gcshop.ch
Ich kann ja einzelne Seiten kanonieren z.b.
link rel="canonical" href="http://tapetenjoe.de/tafelfolien/index.php
Wieviele Seiten kann ich kanonieren?
Ich habe immer am ende Index.php stehen,ist das ein Nachteil?
Freue mich auf eure antwort
@Thomas
Um derartigen Duplicate Content zu vermeiden, kannst du bei deinem CMS/Shop-System schauen, ob es möglich ist, die Indexierung aller Seiten mit jsessionIDs generell zu verhindern. Falls du das Problem nicht auf Seiten des CMS lösen kannst, dann wird der canonical-Tag definitiv hilfreich für dich sein. Du kannst einfach ein <link rel="canonical" href://www.deineSite.com/URL-ohne-session-IDs.php" /> in den <head>-Abschnitt deiner Seiten einbauen, die die Session-IDs oder ähnliche Parameter haben.
@TapetenJoe
Es gibt keine Beschränkung bei der Anzahl der Seiten, die als kanonische URL dienen sollen. Wenn du z. B. einen Shop mit vielen einzelnen Produkt-Seiten hast, die möglicherweise Duplicate Content aufgrund von Session-IDs haben, dann ist es kein Problem, in diesem Fall auf kanonische Versionen dieser Produkt-Seiten zu verweisen. Bezüglich der URL-Struktur deiner kanonischen Seiten ist es gleichgültig, ob die URLs auf index.php enden oder aus statischen HTML-Seiten bestehen - beides funktioniert gleichermaßen.
Hoffe, das hilft bereits weiter :)
Grüße,
Sven
@Thomas
Sorry - ich meinte natürlich:
<link rel="canonical" href="http://www.deineSite.com/URL-ohne-session-IDs.php" />
Sven
Vielen dank für die freundliche Antwort. Bezüglich dem doppelten Content habe ich noch eine Frage.
Um den doppelten Content meiner Seite zu verweiden da unter tapetenjoe.de die selben ergebnisse kommen wie unter www.tapetenjoe.de
habe ich auf meinen server eine .htaccess datei geladen die folgendermaßen aussieht:
#RewriteBase /
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.tapetenjoe.de$ [NC]
RewriteRule ^(.*) http://tapetenjoe.de/$1 [L,R=301]
RewriteCond %{HTTP_HOST} ^www.tapeten-joe.de$ [NC]
RewriteRule ^(.*) http://tapetenjoe.de/$1 [L,R=301]
RewriteCond %{HTTP_HOST} ^tapeten-joe.de$ [NC]
RewriteRule ^(.*) http://tapetenjoe.de/$1 [L,R=301]
Meine Frage:
Ist das korrekt angelegt?
Kann man solch eine Datei auch für die kanonischen URL´s anlegen oder ist es zwingend notwendig den Link link rel="canonical" href="http://domain.de/seite1.html" />
in den Header zu schreiben?
Grundsätzlich ist der Ansatz, für solche Arten von Duplicate Content ein Rewrite in der .htaccess-Datei zu machen, auf jeden Fall OK. Da verschiedene Faktoren einen Einfluss auf die Ausgabe einer Rewrite-Regel haben können, ist es am Besten, die Ausgabe mit einem Tool zum Prüfen der Server-Header zu testen (z. B. wget). Dann kannst du sicher sein, dass in deinem spezifischen Fall auch die gewünschten Ausgaben erfolgen.
Zusätzlich hast du mit unseren Webmaster-Tools auch die Möglichkeit, Einfluss darauf zu nehmen, wie wir deine Site indexieren, indem du die bevorzugte Version deiner Site einstellst (mit www oder ohne www). Du kannst das im Webmaster-Tools-Konto unter "Einstellungen" - "Bevorzugte Domain" festlegen.
Was die kanonischen URLs betrifft: Der entsprechende Tag muss immer im <Head>-Abschnitt der Seiten platziert sein, die auf die kanonische URL verweisen sollen. Innerhalb einer Rewrite-Regel ist dies nicht möglich.
Grüße,
Sven
Was ein Glück , jetzt haben wir hoffentlich ein Problem weniger !
Werden kanonische URL's denn von Google nun auch schon definitiv berücksichtigt?
Ich habe nun seit gut einem Monat kanonische URL's definiert um duplicate content (der durch Google Analytics Tracking Links entstand) zu entfernen.
Ich habe auch doppelt indexierte Seiten erneut bei Google zur Überprüfung angemeldet, aber leider sind diese Seite immer noch im Index.
Hallo piloly,
nachdem du die kanonischen URLs hinzugefügt hast, kann es ggf. etwas dauern, bis diese Änderungen sichtbar sind.
Bei solchen Fällen von Duplicate Content ist es in der Regel nicht erforderlich, einen Antrag auf erneute Überprüfung zu stellen, weil es da ja darum geht, Content wieder zurück in den Index zu bekommen und nicht aus dem Index zu entfernen, wie es bei dir der Fall ist.
Du kannst gern auf unserem Forum für Webmaster posten, wenn du noch detailliertere Fragen zu deinem spezifischen Fall hast.
Hoffe, das hilft schon mal weiter :)
Sven
Ich dachte mit dem erneuten einreichen besucht der Bot erneute genau diese Seite und merkt, dass er die Seite gar nicht indexieren soll, da die kanonische URL für diesen Content eine andere ist.
Ich habe noch eine weitere Frage bzgl. der Reihenfolge von URL Variablen. Sind folgende 2 URL's für Google 2 verschiedene oder werden diese als gleich angesehen?
http://www.domain.tld/test.php?a=1&b=2
http://www.domain.tld/test.php?b=2&a=1
Sollte hier eine kanonische URL verwendet werden um auf eine der beiden Varianten zu verweisen?
@piloly
Rein technisch betrachtet, handelt es sich dabei tatsächlich um zwei verschiedene URLs - dennoch werden unsere Algorithmen bei den meisten solcher Fälle in der Lage sein, zu erkennen, dass es sich nur um die geänderte Reihenfolge der Parameter handelt und entsprechend eine kanonische Version auswählen.
Trotzdem wird es auch in diesem Fall sicher hilfreich sein, wenn zusätzlich noch die bevorzugten URLs mittels des kanonischen Link-Elements bestimmt werden, da dies als gutes weiteres Signal zur Bestimmung der kanonischen URL dient.
Grüße,
Sven
unsere Website hat den Makel das
die index.php immer den selben Header verwendet,also wenn man
navigiert und die Seiten wechselt
bleiben Titel und Keywords immer gleich und es aendert sich nur die Seite in der Mitte.
So ist eben die Konzeption.
Macht es Sinn auf diese Seite (die in der Mitte)den "canonical" Tag
zu setzen oder wuerde der gar nicht
gefunden werden.
Gruesse von Nihil
Hallo,
super Feature, leider meckern die
Webmaster-Tools trotz der kanonischen URLs noch verschieden "dublicate content" Seiten an.
Ist ggf. die Reihenfolge der Attribute "rel" und "href" relevant?
Vielen Dank für die Antwort.
@Nihil
Aufgrund deiner Beschreibung ist mir nicht 100% klar, was du mit "Seite in der Mitte" meinst. Das rel=canonical-Attribut kann bei Seiten verwendet werden, deren Inhalt (mehr oder weniger) komplett identisch ist, d. h. nur doppelt vorhandene Titel oder Keywords reichen da noch nicht (sind also unproblematisch in Bezug auf Duplicate Content).
Hoffe, das hilft schon mal weiter :)
@wojewsky
Es kann einige Zeit dauern, bis die kanonischen URLs eine "sichtbare" Wirkung zeigen. Ebenso verhält es sich mit der Anzeige in den Webmaster-Tools, wo es einige Zeit dauern kann bis die Änderungen aufgrund der kanonischen URLs angezeigt werden. Die Reihenfolge der "rel"- und "href"-Attribute ist dabei vollkommen egal - beides funktioniert gleichermaßen!
Grüße,
Sven
rrr
Eine Frage: Sollte man von der Möglichkeit auch Gebrauch machen, wenn es sich um zwei verschiedene Domains handelt, die aber absolut den selben Inhalt liefern?
Beispiel: Die Adresse "http://www.aachen.ihk.de/index.htm" liefert exakt den selben Inhalt wie "http://www.aachen-ihk.de/index.htm". Ist so etwas auch schon "doppelter Inhalt"? Oder anders gefragt: Wenn ich will, dass nur noch meine Hauptdomain "http://www.aachen.ihk.de" in Google auftaucht, muss ich dann die hier genannten Mittel anwenden, um alle anderen Domains auszuschließen?
Ich freu mich über eine Antwort, das Thema ist sehr spannend.
@multimedia
Das kanonische Link-Element funktioniert nur innerhalb einer Domain, also nicht Domainübergreifend - es würde also in diesem Fall nicht weiterhelfen. Wenn mehrere Domains auf eine Haupt-Domain zeigen sollen, empfiehlt sich die Verwendung einer 301-Weiterleitung (siehe auch http://googlewebmastercentral-de.blogspot.com/2008/04/best-practices-beim-umzug-eurer-site.html und http://www.google.de/support/webmasters/bin/answer.py?hlrm=de&answer=93633).
Hoffe, das hilft weiter!
Sven
Kann eine kanonische URL helfen, meine Website durch Google bevorzugen zu lassen, wenn mein Content geklaut wird?
Beim englischen Original-Post gibt es seit Dezember 09 ein Update zum Thema unterschiedliche Domains. Es ist nun erlaubt, per canonical-Attribut auf eine vollkommen andere Domain zu verweisen!
Bitte passt das noch oben an.
Danke!
Ist es eigentlich richtig eine Sitemap für jede kanonische URL zu erstellen? Beispiel:
www.test.de hat den selben Inhalt wie www.hallowelt.ch reicht es dabei nur eine Sitemap für hallowelt.ch zu erstellen, wenn test.de umgeleitet wird? Ich könnte mir sonst vorstellen das die Sitemaps ziemlich lang werden.
Ist es eigentlich richtig eine Sitemap für jede kanonische URL zu erstellen? Beispiel:
www.test.de hat den selben Inhalt wie www.hallowelt.ch reicht es dabei nur eine Sitemap für hallowelt.ch zu erstellen, wenn test.de umgeleitet wird? Ich könnte mir sonst vorstellen das die Sitemaps ziemlich lang werden.
Hallo Marvin, wenn du test.de zu hallowelt.ch weiter leitest (am besten mit 301) dann solltest du nur für hallowelt.ch eine Sitemap anlegen.
test.de würde ja keine Seiten beinhalten sondern nur Weiterleitungen.
Frage: Muss ich für Unterseiten auch den Pfad dafür angeben oder reicht es aus, die Hauptseite anzugeben?
Was wird im Suchergebnis angezeigt, wenn ich zwei identische Seiten habe, die sich nur mit einem Wort - Stadt01 und Stadt02 unterscheiden, wenn Stadt01 das Original ist und wenn nach dem Content und Stadt02 gesucht wird? Wird die Stadt02-Seite, die ja die Kopie ist, trotzdem gefunden?
Kommentar veröffentlichen