Auch das Crawlen von URLs, die laut Google Search Console aus dem Index ausgeschlossen sind, werden zum Crawl-Budget hinzugezählt.
Nicht nur die tatsächlich indexierten URLs, die Google gecrawlt, werden vom verfügbaren Crawl-Budget abgezogen. Auch URLs, die aus den verschiedensten Gründen aus dem Index ausgeschlossen sind, zählen für das Crawl-Budget. Dazu gehören zum Beispiel URLs, die auf "noindex" gesetzt sind oder URLs, die aufgrund einer anderen Canonical-URL nicht indexiert werden.
Johannes Müller erklärte im Webmaster-Hangout vom 9. August, schließlich müssten auch nicht indexierbare URLs gecrawlt werden, um überhaupt feststellen zu können, ob diese indexierbar seien. Allerdings würde Google URLs, die nicht indexierbar sind, wesentlich seltener crawlen, so dass diese einen vergleichsweise geringen Einfluss auf das Crawl-Budget haben.
Hinzu kommt, dass Google in Fällen, in denen das Crawl-Budget knapp wird, eine zusätzliche Priorisierung vornimmt. Dann werden bevorzugt erst diejenigen URLs gecrawlt, die für die Suche wichtig sind. Wenn zum Beispiel eine Website ein Crawl-Budget von 1.000 URLs habe und über 900 wichtige und außerdem 10.000 vom Index ausgeschlossene Seiten verfüge, würde Google zunächst die 900 wichtigen URLs crawlen und die restlichen 100 URLs des Crawl-Budgets für einen Teil der verbleibenden 10.000 URLs verwenden. Damit kann dann geprüft werden, ob von diesen URLs inzwischen die eine oder andere wieder indexierbar ist.
Titelbild: Copyright WDnet Studio - Fotolia.com
SEO-Newsletter bestellen