Webseiten, auf denen es neben selbst erstellen auch von anderen Seiten eingesammelte Inhalte gibt, können von Google komplett vom Crawlen und Indexieren ausgeschlossen werden.
In einem aktuellen Webmaster-Hangout ging es um eine Webseite, auf der es zusätzlich zu selbst erstellten Inhalten auch einen Bereich mit gescraptem Content gibt, also mit Inhalten, die automatisch auf anderen Seiten gecrawlt und dann zusammengefasst werden. Die Webseite beschäftigt sich mit IT-Themen, zu denen Beiträge auf StackOverflow und anderen Plattformen gesammelt und dann bestimmten Themen zugeordnet werden.
Laut Johannes Müller handelt es sich dabei trotz der thematischen Zusammenfassung um minderwertige Inhalte, weil diese bereits auf anderen Seiten vorkommen. Er empfahl, die entsprechenden Seiten per robots.txt zu sperren - dann sei das für Google kein Problem.
Andernfalls könne es laut Müller sogar passieren, dass Google die komplette Seite nicht mehr crawlt und auch nicht mehr indexiert - davon wären also auch die selbst erstellten Inhalte betroffen.
In den Google Webmaster-Richtlinien werden im Bereich zu automatisch generierten Inhalten unter anderem auch solche Inhalte ausgeschlossen, die durch das "Zusammenfügen oder Kombinieren von Inhalten aus verschiedenen Webseiten, ohne Mehrwert hinzuzufügen" entstehen.
Es ist also keine gute Idee, Inhalte automatisch von anderen Seiten einzusammeln und diese auf der eigenen Seite zusammenzufassen - außer, man heißt Google ;-)
Titelbild: Copyright BillionPhotos.com - Fotolia.com