„Duplicate Content“ ist einer der großen Mythen der SEO-Gemeinde. Grundsätzlich kann man sagen: Google versucht Kopien eines Contents schlechter zu gewichten, als dies für das Original der Fall wäre. Es geht dabei aber natürlich nicht darum, diverse verschiedene Abrufmöglichkeiten des gleichen Contents einer Webseite in irgendeiner Form zu bestrafen. Aber es kann theoretisch vorkommen, dass Google eben eine Abrufmöglichkeit, die nicht das Original sein sollte, als eben jenes auffasst. Nun kann man verschiedene Regeln befolgen (z.B. nicht die gleiche Seite unter verschiedenen Subdomains veröffentlichen), aber ganz gefeit ist man vor solchen Problem nicht. Hier soll „canonical“ Abhilfe schaffen.
„canonical“ ist eine rel-Eigenschaft des Tags „link“ und soll im Header einer (X)HTML-Datei auf das Originaldokument verweisen. Dadurch sollte sichergestellt sein, dass der Google-Crawler immer genau identifizieren kann, welcher Aufruf aus seiner Sicht als „Originalaufruf“ gelten soll. Eine ausführliche Beschreibung inklusive einer Erläuterung des Problems findet ihr im Official Google Webmaster Central Blog. Mit folgendem Tag könnt ihr im Header eurer HTML-Datei (zwischen <head> und </head>) dem Google Bot mitteilen, welches die Original-URL (im folgenden Code-Snippet als Platzhalter ORIGINALURL) sein sollte:
<link rel="canonical" href="ORIGINALURL" />
Ab WordPress 2.9 soll Canonical fester Bestandteil sein. Doch bis ihr auf diese Version upgraded, sollte folgender Hack hilfreich sein:
Innerhalb des <head>-Bereichs eurer header.php fügt ihr folgenden Code ein:
<?php if ( is_singular() ) echo '<link rel="canonical" href="' . get_permalink() . '" />'; ?>
Das war’s schon. Gefunden habe ich diesen WP-Hack bei WP Engineer im Adventskalender.