Google sucht bei mehreren URL-Varianten pro Seite automatisch nach der einfachsten URL und verwendet diese als Canonical, sofern es keine anderen Signale gibt, die dagegen sprechen.
URL-Parameter, Groß- und Kleinschreibung, die Verwendung von "www" und viele Dinge mehr können dazu führen, dass es pro Seite oder Dokument mehrere unterschiedliche URLs gibt.
Google nutzt in diesen Fällen ein leichtgewichtiges System zur Erkennung möglichst einfacher URLs. Dieses System funktioniert auch ohne Signale wie zum Beispiel Canonical Links oder Weiterleitungen.
John Müller erklärte dies in den Google Search Central SEO Office Hours vom 17.12. Zuvor war er gefragt worden, wie Google mit URLs umgehe, bei denen ein Fragezeichen oder ein Kaufmanns-Und am Ende stehe. Laut Müller sind alle diese Varianten für Google zunächst einmal eigenständige URLs, doch sei es mithilfe des genannten Systems möglich, jeweils eine simple URL-Variante zu erkennen.
So sei es zum Beispiel auch bei URLs wie /index.html für die Startseite. Selbst wenn es einen Link auf die URL /index.html gebe, könne Google erkennen, dass diese äquivalent zur URL mit einem einfachen Slash am Ende sei und die URL mit /index.html als irrelevant verwerfen.
Diese Art der Kanonisierung erfolge recht früh und ohne die bekannten Canonical-Signale wie Sitemap, Canonical-Links oder Weiterleitungen.
Ob Google die richtigen URLs erkenne, könne man recht einfach herausfinden. Dazu genügt laut Müller ein Blick in die Logfiles des Webservers. Oder man schaut sich in der Google Search Console an, welche URLs Google in den Suchergebnissen anzeigt.
Titelild: Copyright fotomek - Fotolia.com
SEO-Newsletter bestellen