Google hat im Webspam Report 2020 beeindruckende Zahlen veröffentlicht. Demnach erkennt Google jeden Tag 40 Milliarden Spamseiten. Die Spamerkennung findet dabei auf mehreren Ebenen statt.
Einmal pro Jahr veröffentlicht Google den Webspam Report. Darin beschreibt Google seine Maßnahmen gegen Spam in den Suchergebnissen. Zur Erkennung von Spam nutzt Google Techniken der künstlichen Intelligenz.
Im Webspam Report 2020 berichtet Google davon, dass automatisch erzeugte und gescrapte Inhalte um 80 Prozent gegenüber dem Stand vor einigen Jahren reduziert werden konnten. Die Möglichkeiten zum Erkennen gehackter Inhalte haben sich um 50 Prozent verbessert, wobei Google keinen Vergleichszeitraum nennt.
Jeden Tag entdeckt Google etwa 40 Milliarden Spamseiten. Dabei findet die Erkennung von Spam auf unterschiedlichen Ebenen statt: beim Crawlen, im Index und durch manuelle Maßnahmen:
Manche Inhalte, die beim Crawlen als Spam erkannt werden, gelangen gar nicht erst in den Google-Index. Davon können auch Inhalte betroffen sein, auf die Google in Sitemaps stößt oder die per Google Search Console zum Indexieren eingereicht werden. Gerade dieser Kanal wird häufig von Hackern genutzt, die sich Zugang zu einer Website verschaffen und diese in der Google Search Console anmelden.
Auch Inhalte, die bereits indexiert sind, werden auf Spamverdacht geprüft. Nach dem Eingeben einer Suchanfrage werden die Inhalte, die als relevant für die Suchanfrage angesehen werden, daraufhin untersucht, ob es sich um Spam handeln könnte. In diesem Fall werden sie nicht auf den Top-Platzierungen angezeigt. Zudem werden die dadurch ermittelten Informationen dazu verwendet, ähnliche Inhalte gar nicht erst zu indexieren.
Laut Google sollen diese Mechanismen dafür sorgen, dass mehr als 99 Prozent aller Websitebesuche, die aus der Suche stammen, ohne Kontakt mit Spam ablaufen. Der kleine verbleibende Rest kann Gegenstand von manuellen Maßnahmen durch Google werden.
Hinzu kommt, dass Google seit 2018 Hunderte Millionen von Suchanfragen vor sogenannten Scam- und Fraudseiten geschützt hat, die sich zum Beispiel als offizielle Supportseiten ausgeben und die Seitenbesucher dazu bewegen sollen, Geld per Banküberweisung oder auf anderen Wegen zu übermitteln.
Bilder: Google
SEO-Newsletter bestellen