XML-Sitemaps werden von Google als schwächeres Signal zur Auswahl von kanonischen Seiten betrachtet als die Anweisung rel='canonical'.
Google nutzt verschiedene Signale, um zu bewerten, welche URLs indexiert werden sollen. Dazu gehören auch XML-Sitemaps und die Canonical-Anweisung im Quellcode nach dem Muster
<link rel="canonical" href="/[URL]" />
Sowohl XML-Sitemap als auch Canonical-Links können zum Vermeiden von Duplicate Content verwendet werden. Google wertet XML-Sitemaps als Signal bei der Auswahl der relevanten URLs.
Dies ist möglich, indem in eine Sitemap nur die URLs aufgenommen werden, die auch tatsächlich indexiert werden sollen. Allerdings sind viele Tools zum Erstellen von XML-Sitemaps nicht sehr wählerisch und rfügen jede auf einer Webseite verfügbare URL in das Dokument ein.
Das wird einer der Gründe dafür sein, dass Google auf seiner jetzt neu gestalteten Hilfeseite zum Thema "Doppelte URLs zusammenfassen" XML-Sitemaps als weniger starkes Signal bezeichnet als Canonical-Links. Der nachfolgende Screenshot zeigt den betreffenden Ausschnitt aus der Seite:
Als weiteren Nachteil von XML-Sitemaps nennt Google die Notwendigkeit, auch dann noch Seiten auf Duplikate prüfen zu müssen, wenn in einer Sitemap nur kanonische URLs aufgenommen werden.
Dazu kommt ein weiteres Problem: XML-Sitemaps werden oftmals nicht häufig genug aktualisiert, um den Ansprüchen zur Vermeidung von Duplicate Content zu genügen, und sind daher für Google weniger verlässlich.
Die Empfehlung lautet also, im Zweifelsfall auf Canonical-Links auf den einzelnen Seiten zu setzen. Falls Canonicals per XML-Sitemap definiert werden, muss sichergestellt sein, dass sich darin keine Duplikate befinden.
Vielen Dank an The SEM Post
Titelbild © teguhjatipras - Fotolia.com