SEO-News

SuchmaschinenbotDirektiven mit Hash-Zeichen in der robots.txt können unter Umständen dazu führen, dass Google eine komplette Website nicht mehr crawlt. Hash-URLs werden von Google ohnehin meist ignoriert.

Auf manchen Websites kommen URLs mit Hash-Zeichen zum Einsatz: zum Beispiel auf AJAX-Seiten oder als Anker, um bestimmte Seitenbereiche direkt anspringen zu können. Der Bereich hinter einem Hash-Zeichen, das sogenannte URL-Fragment, wird von Google in der Regel ignoriert - mit wenigen Ausnahmen.

Die Verwendung von Hashes in der robots.txt kann ganz andere Probleme mit sich bringen: Sie kann sogar dazu führen, dass eine komplette Website nicht mehr gecrawlt wird. So war es in einem aktuellen Fall, der gerade auf Twitter zu sehen war. Ein Webmaster hatte sich gewundert, dass Google einige Seiten nicht indexiert hatte, weil sie per robots.txt blockiert waren. Offenbar gab es in der robots.txt die Direktive Disallow: /#*, um alle URLs mit Hash-Fragmenten zu sperren.

Das Hash-Zeichen dient in der robots.txt jedoch zur Kennzeichnung von Kommentaren. Die Folge: die Direktive wurde interpretiert als Disallow: /, was bewirkt, dass alle Seiten gesperrt sind. Das erklärte Johannes Müller in seiner Antwort:

 

Google: Hashes in robots.txt dienen zur Kennzeichnung von Kommentaren 

Müller erklärte, mit der Zeit würden die URLs erneut verarbeitet, und sie sollten dann wieder normal indexierbar sein.

Weil Google URL-Fragmente ohnehin nicht crawlt, ist es auch nicht notwendig, diese in der robots.txt anzugeben.

 

Titelbild: Copyright Patrick Daxenbichler - Fotolia.com

 

Verwandte Beiträge

Hashtags auf Webseiten haben für Google keine besondere Bedeutung, sondern werden wie normale Worte behandelt.

Zwar ignoriert Google normalerweise den Teil in URLs, der sich hinter einem Hash-Symbol verbirgt, doch werden Links auf solche URLs dennoch gewertet.

In der Google Search Console können auch sogenannte Links to Text auftauchen, also URLs, die auf konkrete Textstellen auf einer Seite verweisen. Normalerweise zeigt die Google...

SEO-Newsletter bestellen

Im monatlichen SEO-Newsletter erhaltet Ihr eine Übersicht der jeweils zehn wichtigsten SEO-Meldungen des Monats. Mit dem SEO-Newsletter bleibt Ihr auf dem Laufenden.
Ich bin mit den Nutzungsbedingungen einverstanden

Anzeige

rnkeffect

Premium-Partner (Anzeige)


Anzeigen InternetX

SEO Agentur aus Darmstadt

Better sell online

Online Solutions Group

Onsite-Optimierung

Onsite-Optimierung

 

Sprecher auf

SEO- und Suchmaschinenblogs

SEO-FAQ

Bild © FM2 - Fotolia.com

SEO selber machen

SEO selber machen

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO im Ohr, der Podcast von SEO Südwest: aktuell Folge

SEO-Beratung

Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.

Social Networks und RSS-Feed

Auszeichnungen

seo19 sieger sichtbarkeit 2020 200x200px