Aktualisiert: Das Canonical Tag im SEO-Einsatz

Weiterleitung per Canonical: Vorsicht vor drohendem Chaos ;-)

Weiterleitung per Canonical: Vorsicht vor drohendem Chaos ;-)

Das in die Meta-Angaben einer Webseite eingebaute „Canonical Tag“ ist für Webmaster ein Segen. Es ist ein Schutz vor Duplicate Content, macht so manche Weiterleitung unnötig – und ist die Quelle vieler SEO-Fehler. Diese „kanonische URL“ zeigt dem Google-Robot  den eigentlichen Ursprung eines Seiteninhalts – und zwar so zuverlässig, dass schon kleine Fehler zur Katastrophe werden können. Hier eine Einführung in das Canonical Tag.

Doppelte Inhalte, auch „Duplicate Content“ genannt, entstehen oft unabsichtlich manchmal auch absichtlich. Doch schädlich für Google ist solcher DC immer und muss weg. Im Gegensatz zu einer 301-Weiterleitung bietet das Canonical Tag die Möglichkeit, zwei Instanzen eines Inhalts für die User zu behalten – der Suchmaschine aber nur eine als „wichtig“ zu präsentieren. Soweit jedenfalls die bestimmungsgemäße Verwendung…

Hier eine kleine Zusammenfassung, wie man damit umgeht und welche Gefahren damit einher gehen.

1. Grundsätzliche Verwendung des Canonical Tag

Sei es, das man den Inhalt einer Unterseite mehrfach anzeigen möchte, oder sei es, dass das Content Management System zu blöd ist, einzigartige Seiten zu bauen (und zum Beispiel unnötige Parameter an die URL hängt). In beiden Fällen gibt es eine einzige „richtige“ und eine oder oder mehrere „falsche“ Seiten. Für den korrekten Einsatz des canonical-Tags in diesen Fällen sollte man auf den „falschen“ Seiten in den Header folgende Zeile (angepasst) schreiben:

<link rel=“canonical“ href=“http://www.domain.de/richtige-URL“ />

Das ist aber nur eine Variante. Ein Canonical-Tag kann z.B. auch für ein PDF-Dokument verwendet werden. Dieses hat allerdings keine Meta-Angaben wie eine HTML-Seite. Dort wird das Tag dann im so genannten HTTP-Header eingebaut. Dazu gehört ein bisschen technisches Know-How. Alles darüber übrigens hier, bei Google.

Da man natürlich nicht weiß, wann das CMS Unfug produziert, loht es sich, das Canonical-Tag auf jeder Seite auf sich selbst zu setzen. Dann referenziert es sich selbst – und wenn etwas mit der Technik schief läuft, ist es so etwas wie eine Versicherung und hilft unter anderem dann, wenn irgend ein Prozess einen oder mehrere Parameter an die URL anhängt, z.B. eine Session-ID oder ein Tracking-Parameter. Die damit aufgerufenen URLs verweisen dann per Canonical-Tag zuverlässig auf die „Rumfp-URL“ und Fehler werden vermieden.

Ein häufiger Fall ist das bei der Homepage, die – je nach CMS – immer wieder unter / oder /index.html und/oder /index.php oder so zu finden ist. Sinnvoll ist dann ein Canonical-Tag z.B. auf die Variation mit /. Oder wenn sich das System nicht so ganz sicher ist, ob es seine URLs mit oder ohne Trailing Slash (also /) ausspielt. Dann sollte das einmal klar via Canonical-Tag definiert sein. Oder wenn man Gefahr läuft, dass die Seiten auch ohne „www“ erreichbar sind. Oder, oder, oder…

Übrigens: Damit du nicht immer im Code kruschteln musst, kannst du dir mit dem Firefox-Addon „Search Status“ das Canonical-Tag anzeigen lassen. Das sieht dann so aus:

Wenn der Search-Status blau ist, zeigt das Canonical-Tag auf eine andere Seite. Bei grau auf sich selbst und wenn das "C" nicht da ist, gibt es kein Canonical-Tag.

Wenn der Search-Status blau ist, zeigt das Canonical-Tag auf eine andere Seite. Bei grau auf sich selbst und wenn das „C“ nicht da ist, gibt es kein Canonical-Tag.

2. Hinweise, Warnungen und Benutzerhinweise

Man kann mit dem Canonical-Tag auch so manches einfach falsch machen. Deshalb hier eine Liste von Fehlern und Hinweisen, die wir häufig sehen.

  • Die kanonisierte URL (also die URL auf die das Canonical-Tag zeigt) sollte idealerweise deine Haupt-URL für diesen Content sein. Mindestens sollte sie jedoch diese sein, die z.B. aus der Navigation heraus verlinkt wird. Falsch wäre es also, wenn du mir mehren URLs für einen Inhalt arbeitest und von allen Varianten auf eine URL kanonisierst, die NICHT verlinkt ist. In dem Beispiel oben mit der Startseite sollte dann vom Logo also die Homepage mit der URL-Variante mit / verlinkt sein. Dann wird Google skeptisch.
  • Das Canonical-Tag ist ein Vorschlag kein Befehl: Wir sehen immer wieder Seiten mit wegführendem Canonical-Tag in den Suchergebnissen. Google empfindet das Tag eher als Vorschlag und nicht als unbedingte Anweisung. Du kannst dich mittlerweile also nicht mehr darauf verlassen.
  • Das Canonical-Tag ist keine grundsätzliche DC-Lösung: Wer sich allzusehr aufs Canonical-Tag verlässt, macht es sich zu einfach. Denn wenn sehr viele Seiten via Canonical zusammen gefasst werden, müssen diese trotzdem gecrawlt werden. Und das läuft gegen dein Crawling- und Indexierungs-Budget. Wenn du also viele Varianten einer URL hast, baue nicht nur ein Canonical-Tag ein sondern überlege, ob diese Varianten denn überhaupt notwendig und sinnvoll sind.
  • Auf paginierte Seiten gehört KEIN Canonical-Tag auf die erste Seite: Ein typischer Fehler ist, wenn paginierte Folge-Seiten (also Seite 2 bis n) auf die erste Seite der Pagninierung mit einem Canonical verweisen. Das ergibt sich schon aus der Definition des Canonical-Tags: Die Seite zwei einer Beitragsliste ist KEIN Duplicate Content.
  • In der XML-Sitemap haben Seiten mit wegführendem Canonical-Tag nichts zu suchen. Natürlich gehören in die XML-Sitemap nur URLs, die auch indexierbar sind. Und Seiten mit wegführendem Canonical-Tag gehören nicht dazu.
  • Bei der Umstellung auf https muss das Canonical-Tag angepasst werden! Argh! Das passiert wirklich häufig: Da stellt man auf https um, macht alles zuverlässig – aber vergisst das Canonical-Tag. Das Ergebnis: Seiten mit http (ohne „s“) werden auf https umgeleitet und diese Seiten zeigen per Canonical auf die Variante ohne „s“. In aller Regel versteht Google das eigentlich ganz gut – aber das ist definitiv ein Fehler und so etwas kann man schon richtig machen…
  • Ein Canonical-Tag wird absolut angegeben: Wir SEOs möchten ja, dass alle internen Links auf der Seite absolut (http://www.domain.de/verzeichnis/index.html) und nicht relativ (/verzeichnis/index.html) angegeben werden. Nun, darüber kann man diskutieren. Das Canonical-Tag aber bitte IMMER absolut angeben. Es funktioniert zwar irgendwie auch relativ – aber das macht echt keinen Sinn.
  • Das Canonical gehört auch um Werkzeugsatz für mobile Webseiten: Das ist ein wenig ein anderes Thema, aber hier mehr darüber.
  • Auf alle Seiten mit „noindex“ gehört kein Canonical-Tag: Nun, das lässt sich nicht immer vermeiden. Aber vom Grundsatz her, wünscht sich Google von uns, dass wir Indexierungs-Regeln (auch zusammen mit der robots.txt) nicht mischen. Eine Seite mit „noindex“ und einem Canoncial-Tag (die am Ende auch noch in der robots.txt gesperrt ist) darf es also eigentlich gar nicht geben…
  • Bei der Internationalisierung muss das Canonical-Tag mit dem hreflang synchronisiert werden: Eine Seite, die per Canonical-Tag auf eine andere zeigt, sollte natürlich NICHT per hreflang auf eine anderssprachrige URL z.B. in Frankreich zeigen. Das ist ein Anweisungs-Kuddelmuddel und damit verwirrt man Google. Was niemals gut ist…

Die Lösung für Content-Syndizierung: externe Verwendung des canonical-Tag

Jünger als die interne Verwendung ist die domainübergreifende Verwendung des Canonical Tag. Also von Webseite 1 zu Webseite 2. Damit ist das Canonical Tag der feuchte Traum eines jeden Content-Syndizierers: Denn wenn die Kunden, die etwa die Inhalte von Magazin xy übernehmen, auf dessen Seite ein Canonical Tag setzen, gewinnt beim Wettrennen um die ersten Plätze immer der Urheber. Das Problem: Die Kunden werden genau DAS nicht wollen….

Doch zur Verwendung des Tags: Diese ist genauso wie intern. Auf die „kopierten“ Seiten geht im Header ein Link zum Ursprungscontent (und zwar auf die Unterseite und NICHT auf die Homepage):

<link rel=“canonical“ href=“http://www.domain.de/richtige-URL“ />

In jedem Fall ist der Einsatz des Tags sehr günstig für die inhaltsgebende Seite. Denn ist auf der inhaltnehmenden Seite der Tag eingebaut, wird Google sofort erkennen, woher der Inhalt stammt und diese Seite besser stellen. Ob die Links, die auf die inhaltsnehmende Seite zeigen, auch umgebogen werden oder doch für diese rechnen, ist noch nicht erkennbar. Beides ist denkbar. Unwahrscheinlich (und bisher auch nicht zu beobachten) ist, dass die inhaltnehmende Seite aus dem Index komplett verschwindet – das wäre eine Bestrafung für den fairen Einsatz des Tags. Und so handelt Google eigentlich nicht.

Interessant und durchaus diskussionswürdig ist, dass das Canonical Tag – wenn es domainübergreifend eingesetzt wird – auch ein klares Signal setzt, dass auch die Bewertung dritter Seiten beeinflusst. Denn wenn die Seiten B, C und D Inhalte von der Seite A haben und mit dem Canonical Tag auf A zeigen, wird sich die Seite E sehr schwer tun, mit dem möglicherweise gescrapten Content vernünftig zu ranken und auch ohne ihr Zutun wird A als Urheber der Seite „erkannt“. So weit die „weiße“ Seite der Medaille. Auf der schwarzen Seite könnten natürlich die Seiten A, B, C und D die „bösen“ sein und der Inhalt von E stammen. Was meint ihr, wer würde dann damit ranken? Die Antwort auf diese Frage ist nicht sehr erfreulich…

Tricks mit dem Canonical Tag

…werden wir natürlich nicht ausführlich beschreiben. Denn diese sollte man nur einsetzen, wenn man seine Technik wirklich sehr gut im Griff hat. Sollte irgendwann Google das Canonical Tag korrekter einsetzen als bisher, könnte man mit solchen Tricks auf die SEO-Nase fallen.

Aber für kreative Geister hier der Hintergrund: Das Canonical Tag lässt eine Seite für den User zwar existieren, überträgt aber deren „Linkjuice“ auf eine andere. Man könnte also auf die Idee kommen, eine stark verlinkte Seiten (die einem aus SEO-Sicht nicht wichtig ist) mit einem Canonical Tag auf eine schwächer verlinkte Seite (die einem aus SEO-Sicht sehr wichtig ist) zu verlinken. Egal, ob darauf nun der gleiche Inhalt ist oder nicht.

Zugegeben: Das funktioniert derzeit wirklich gut. Google wertet so ein Canonical-Tag irgendwie wie ein starken Link. Und nicht nur intern. Also vielleicht denken auch mal alle bösen Jungs darüber nach, wie man sonst noch… Ach, darauf kommt ihr schon selbst.

Fazit: man sollte wissen, was man tut

Also: Bei jedem absichtlichen und unabsichtlichen Auftreten von Duplicate Content ist das das Canonical Tag logisch, hilfreich und sinnvoll. Allerdings wirkt es manchmall auch sehr kompromisslos. Deshalb sollte man wirklich genau wissen, was man da tut und das Ergebnis auf der Webseite im Livebetrieb unbedingt ausführlich testen.

 

GD Star Rating
loading...
Aktualisiert: Das Canonical Tag im SEO-Einsatz, 3.6 out of 5 based on 11 ratings

Eric Kubitz

Eric Kubitz ist einer der Chefs der CONTENTmanufaktur GmbH . Außerdem ist er Redner auf Konferenzen, Dozent bei Hochschulen, schreibt über SEO (und über andere Dinge) und ist der Chefredakteur des SEO-Book.

More Posts - Website - Twitter - Facebook - LinkedIn - Google Plus

Kommentare (20)

  1. shan_dark

    Danke für den Artikel – ist gut praktisch und verständlich.

  2. claude

    Interessant, aber..
    Was im folgenden Fall:

    Wir scrapen unseren eigenen Content von 3 WordPress-Blogs (A,B,C) in eine Seite Z hinein, und zwar OHNE Backlink zur Quelle.
    Copyrights sind also irrelevant.

    Diese Artikel erscheinen also 2x im Suchindex, einmal auf der Quelle, einmal im Ziel. Da es [derzeit] keinen Link-Verweis zurück gibt, macht das canonical auch keinen Sinn… oder?

    🙂

  3. Eric Kubitz (Beitrag Autor)

    Doch, canonical braucht keinen Link. Wenn du mit Seite Z zeigen möchtest, das Blog A der Publisher ist – dann ist das Tag dafür perfekt.

  4. claude

    Schon klar, aber eigentlich möchte ich das gar nicht ‚zeigen‘.
    A, B und C sollen nur den Content liefern, deren Ranking ist sekundär.

    Wichtig ist mir nur, dass ich mir das ‚hohe‘ Ranking von Z nicht versehentlich zerschiesse… 😉

  5. Pingback: SEO: Canonical – Kampf den Dopplungen » t3n Magazin

  6. Dina Lewicki

    Hi,
    wirklich super Artikel. Ich habe nur ein Verständnisproblem (wahrscheinlich). Du schreibst oben, dass Linkjuice und power von canonicalten URLs/Seiten auf die Zielseiten weitergegeben wird. Im letzten Punkt unter „Was man nicht machen sollte“ sagst Du, dass alle Seiten ab Seite 2 nicht mehr sauber mit Linkjuice versorgt wurden und diese ‚verkümmerten‘. Das ist mir nicht ganz schlüssig. Wie würdest Du es denn bei Paginierungen empfehlen, z.B. in einem Shop (1-n Produktseiten zu einer Kategorie)?
    Danke und viele Grüße
    Frau Dark 🙂

  7. eric108

    Hallo Frau Dark!
    Da steckt der Teufel im Detail: Die Links werden ordentlich „umgebogen“. Aber das führt auch dazu, dass die von der Seite mit dem Canonical-Tag nichts mehr weiter zu geben hat. Deshalb verkümmert nicht diese Seite, sondern die Beitrags- bzw. Produkt-Seiten, die „dran hängen“. Wenn du also auf der ersten Seite 20 Produkte zeigst und auf der zweiten noch mal 20, werden die zweiten zwanzig „verkümmern, weil sie über die paginierte Seite keinen Linkjuice mehr bekommen.

    Deshalb würde ich das auf keinen Fall machen sondern auf die Seiten 2 bis unendlich (auch in einem Shop) immer „noindex,follow“ schreiben.

    Ein Zusatztipp (für die Hilfe vorhin): Du kannst auch die erste Seite auf, sagen wir mal „Handys“ optimieren (index,follow) und die zweite Seite (wenn du dort etwas Text unterbringen kannst) auf „Handy“ (index,follow und kein Canonical). Dann ab Seite 3 halt „noindex,follow“. Damit erhöhst du die Zahl der optimierbaren Seiten 😉

    Ist aber technisch nicht ganz trivial.

    fröhliche grüße
    eric

  8. Pingback: Canonical-Tag: Von der bevorzugten URL abweichende Navigations-Links negativ? | SEO Book

  9. stefan k

    Hallo Herr Kubiz,
    das ist ein seh rgelungener Artikel, der viele Fragen klärt.
    Dennoch bleibt bei mir ein Punkt offen. Sie schreiben das immer mit www. das Canonical-Tag gesetzt werden soll. Momentan ist das auf unserer Webseite leider nicht der Fall. Gibt es Möglichkeit, (ein Tool) womit die techn Tauglichkeit überprüft wird? Momentan bin ich mir ein wenig unsicher, und hätte gerne ein kurzes Feedback, bevor ich an die Agentur trete und denen sage, dass die das ändern sollen

  10. eric108

    stefan k   Verstehe ich Sie richtig, dass Ihre Seite ohne www publiziert wird? Na dann sollte das www natürlich nicht mit drin sein. Es geht ja um die URL, wie sie der User sieht. Da kann ich Ihnen kein Tool empfehlen…

  11. Pingback: SEO: Die fünf häufigsten Fehler mit dem Canonical-Tag » t3n - Das Magazin für Digitales Business | we love technology

  12. Pingback: 5 Tipps zur Optimierung der internen VerlinkungSEO Book

  13. patrick meyer

    Hallo Herr Kubitz,
    vielen Dank für Ihre Artikel!
    Eine Frage hätte ich dazu, vielleicht können Sie dazu etwas sagen? 
    In die Sitemap können die Homepage und Rubrik-Hauptseiten nur mit „index.php“ automatisch aufgenommen werden also http://www.domain.de/index.php oder http://www.domain.de/profil/index.php. Über die .htaccess Datei werden aber alle diese Seiten per 301 rewrite /…/index.php unterdrückt, um Duplicate Content zu vermeiden (Anzeige also z.B. nur http://www.domain.de/profil/). Wie setzt man da am besten den Canonical Tag ein? http://www.domain.de/index.php oder nur http://www.domain.de/? Oder gar nicht? Herzlichen Dank.

  14. eric108

    patrick meyer Also, um ehrlich zu sein: Ich würde das System reparieren und in die XML-Sitemap korrekte Seiten eintragen. Und ich finde auch, dass ein Redirect besser ist als ein Canonical Tag in solchen Fällen.

  15. patrick meyer

    eric108 patrick meyer Danke sehr!

  16. Pingback: Paginierte Seiten: Noindex,Follow vs. Canonical-Tag oder doch beides?SEO Book

  17. Pingback: Etwa 22 Werkzeuge für bessere Crawlability - Onpage -SEO Book

  18. Sven

    Zitat: „Auf pagninierte Seiten gehört KEIN Canonical-Tag auf die erste Seite:“

    Hier im Blog auf der ersten Seite:
    „canonical“ ….net/blog“

    Ich finde, dass der Canonical-Tag hier richtig ist. Wo liegt das Missverständnis?

  19. Eric

    Ach so, natürlich ist gemeint, dass kein Canonical-Tag von der zweiten oder n-ten Seite auf die erste Seite zeigen soll. Das werde ich wohl klarer verständlich formulieren müssen…

  20. Christoph Baur

    Sven damit ist gemeint, dass du nicht von der 2. paginierten Seite (https://www.contentmanufaktur.net/blog/page/2) ein Canonical-Tag auf die erste paginierte Seite (https://www.contentmanufaktur.net/blog/) setzen sollst, weil der Googlebot sonst den Inhalt der zweiten Seite nicht ausliest und du damit praktisch diese Seiten abschneidest.

Schreiben Sie einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *