Per X-Robots-Tag im HTTP-Header lässt sich das Indexieren einzelner Seiten und Ressourcen individuell steuern. Anders als bei Meta-Robots-Tags können einzelne User Agents wie bestimmte Suchmaschinen gesondert behandelt werden. Ein weiterer Vorteil: Auch das Indexieren von Ressourcen wie Bildern lässt sich per X-Robots-Tag steuern.
Per X-Robots-Tag lässt sich die Indexierung von Seiten und anderen Dokumenten durch Suchmaschinen steuern. Das X-Robots-Tag kann in der Antwort des Servers auf eine Anfrage des Clients mitgesendet werden. Wenn eine URL wie zum Beispiel eine HTML-Seite abgerufen wird, kann per X-Robots-Tag angegeben werden, ob das Dokument indexiert und ob den darin enthaltenen Links gefolgt werden soll.
Grundsätzlich funktioniert die Anwendung des X-Robots-Tag wie das Meta-Robots-Tag. Anweisungen wie "noindex" und "nofollow" gibt es auch hier:
Indexieren der Suchmaschinen individuell per X-Robots-Tag steuern
Während jedoch bei der Verwendung des Meta-Robots-Tags keine Unterscheidung zwischen verschiedenen User Agents und Suchmaschinen möglich ist, lässt sich per X-Robots-Tag festlegen, dass bestimmte Suchmaschinen Inhalte indexieren dürfen, andere dagegen nicht. Im folgenden Beispiel darf die betreffende Seite vom Googlebot indexiert werden, ohne dass der Crawler den darauf enthaltenen Links folgen darf. Den anderen Suchmaschinen-Crawlern ist weder das Indexieren der Seite noch das Folgen der Links gestattet:
Damit ermöglicht das X-Robots-Tag eine ähnliche Differenzierung wie die robots.txt-Datei. Der Unterschied dabei ist, dass die robots.txt das Crawlen steuert, während es beim X-Robots-Tag um die Indexierung geht.
Indexierung von Bildern und anderen Ressourcen per X-Robots-Tag steuern
Ein weiterer Vorteil des X-Robots-Tags besteht darin, dass sich auch die Indexierung von Ressourcen wie Bildern steuern lässt. Das ist mit dem Meta-Robots-Tag nicht möglich.
Wenn also zum Beispiel eine Seite von Google indexiert werden soll, ein bestimmtes, auf der Seite enthaltenes Bild jedoch nicht, lässt sich dies einfach per X-Robots-Tag lösen. Diese Möglichkeit bestätigte Johannes Müller von Google in einem aktuellen Webmaster-Hangout.
Weitere Steuerungsmöglichkeiten per X-Robots-Tag
Neben den genannten Anwendungsfällen bietet das X-Robots-Tag noch eine Reihe weiterer Parameter, die sich auf die Indexierung von Seiten und Ressourcen auswirken:
all | Keine Einschränkungen für die Indexierung. 'all' ist der Standardwert und hat keine Auswirkungen, wenn er angegeben wird. |
none | Entspricht der Angabe von noindex, nofollow |
noarchive | Keinen Link auf die Google Cache-Version in den Suchergebnissen anzeigen |
nosnippet | In den Suchergebnissen soll kein Text-Snippet und auch keine Videovorschau angezeigt werden. Falls verfügbar, wird jedoch weiterhin eine statische Miniaturansicht gezeigt |
notranslate | In den Suchergebnissen soll keine Übersetzung angezeigt werden |
noimageindex | Auf der betreffenden Seite kein Bild indexieren |
unavailable_after [Zeitangabe] | Die Seite soll nur bis zum genannten Datum / zur genannten Zeit in den Suchergebnissen erscheinen. Datums- und Zeitangabe sind im Format RFC 850 anzugeben. |
X-Robots-Tag: Flexibilität für die Steuerung der Indexierung
Das X-Robots-Tag ist also eine flexible Alternative zum Meta-Robots-Tag. Wer die Indexierung seiner Seiten für die einzelnen Suchmaschinen unterschiedlich handhaben möchte und wer auf eine individuelle Regelung der Indexierbarkeit von Ressourcen wie Bildern wert legt, dem wird das X-Robots-Tag wertvolle Dienste leisten.
Titelbild: Copyright Patrick Daxenbichler - Fotlia.com