Canonical Tag

Canonical TagIm Jahr 2009 haben Suchmaschinen den Canonical Tag eingeführt – warum? Eines der grössten Schwierigkeiten von Suchmaschinen ist der Kampf gegen Duplicate Content. Identische oder ähnliche Inhalte führen nicht nur dazu, dass Suchmaschinen wie Google und Yahoo unnötig viele Webseiten crawlen, sondern gleichzeitig, dass die indexierten Pages dem Suchenden keinen Mehrwert bieten. Folglich werden die Suchergebnisse schlechter, was im Gegensatz zu den Zielen der Suchmaschinen steht: Usern die bestmöglichen Ergebnisse zu Suchanfragen zu liefern. Der Canonical Tag sorgt für Abhilfe, da er als HTML-Angabe im Quellcode einer Webseite auf Originalinhalte beziehungsweise Duplicate Content hinweist. In der Folge weiss der Suchmaschinencrawler, dass die kanonische (bevorzugte) URL als Originalquelle zu betrachten und zu indexieren ist. Eine Garantie, dass die bevorzugte URL indexiert wird, gibt es nicht, wenngleich Suchmaschinen diesem Hinweis in der Regel folgen.

Anwendungsbereiche

Der Canonical Tag wird gegen Duplicate Content eingesetzt, was die Kenntnis von identischen oder ähnlichen Inhalten voraussetzt. Hieraus ergeben sich unterschiedliche Möglichkeiten beziehungsweise Situationen, in denen der Canonical Tag gesetzt werden sollte. Viele Webseiten sind über unterschiedliche URLs aufrufbar (z.B. mit und ohne www.), was folglich zu Duplicate Content führt. Ebenso können URLs mit und ohne Gross- und Kleinschreibung oder Session-IDs das Problem von doppelten Inhalten hervorbringen. Zu beachten sind weiterhin die verschiedenen Versionen von Webseiten, beispielsweise als Druckausgabe oder PDF. Problematisch sind auch Pressemitteilungen, die auf zahlreichen PR-Portalen im Internet veröffentlicht werden, gleichzeitig aber auch auf der eigenen Webseite.

Die Ausweisung einer kanonischen URL erfolgt in der Regel im Head-Bereich des Quellcodes einer Webseite, damit Suchmaschinencrawler den Verweis als Original direkt zu Beginn des Crawling-Prozesses erkennen. Der Canonical Tag besteht aus einem Link-Attribut und dem Verweis rel=“canonical“ und sieht im Quellcode wie folgt aus: <link rel=“canonical“ href=“http://www.beispiel.de/Beispielseite“/>. In diesem Beispiel wird die gesamte URL angegeben (mit www.), was von Suchmaschinen favorisiert wird und der Idealfall sein sollte. Andernfalls kann es wieder zu Missverständnissen beziehungsweise Fehlern bei der Indexierung kommen.

Wann ein Canonical Tag nicht hilfreich ist

Nicht in jedem Fall ist es sinnvoll ein Canonical Tag zu setzen beziehungsweise löst der Verweis nicht in jeder Situation das Problem. Das trifft vor allem auf den Content-Klau zu. Hierbei wird die gesamte Webseite kopiert und Inhalte werden unter einer anderen URL dargestellt. In diesem Fall entsteht Duplicate Content, der von Webmastern nicht einfach zu entfernen ist, da das Canonical Tag nicht auf der fremden Webseite eingebaut werden kann.