Google hat den BERT-Algorithmus für weitere Sprachen ausgerollt. Welche das sind, ist noch nicht bekannt.
Eines der größten Google-Updates der letzten Zeit ist BERT. Hinter dieser Abkürzung verbirgt sich der Begriff "Bidirectional Encoder Representations from Transformers". BERT soll Google dabei unterstützen, natürliche Sprache besser zu verstehen, indem auch Beziehungen zwischen einzelnen Begriffen in Suchanfragen berücksichtigt werden.
BERT war zunächst nur für die englische Sprache ausgerollt worden, wenngleich Google erklärte, dass der Algorithmus Gelerntes auch auf andere Sprachen übertragen könne.
Eine Ausnahme sind Featured Snippets: Hier wurde BERT bereits für eine größere Menge von Sprachen genutzt. Von 24 Ländern war die Rede.
Jetzt hat Google BERT offenbar auf weitere Länder ausgeweitet. Das erklärte Danny Sullivan von Google per Twitter auf Anfrage. Zunächst hatte er noch geschrieben, BERT wirke sich außerhalb der englischen Sprache nur auf Featured Snippets aus. Einige Minuten später korrigierte er das und schrieb, BERT sei wohl tatsächlich ausgeweitet worden. Weitere Informationen sollen bald über das Twitter-Konto @searchliaison folgen:
Auf welche Sprachen BERT nun ausgeweitet wurde, ist noch nicht bekannt. Diese Informationen werden sicherlich in Kürze folgen.
Update 22:44 Uhr: Google hat die Liste der zusätzlichen Sprachen veröffentlicht, für welche BERT jetzt aktiv ist. Auch Deutsch ist mit dabei, außerdem auch Afrikaans, Albanisch, Amharisch, Arabisch, Armenisch, Aserbaidschanisch, Baskisch, Weißrussisch, Bulgarisch, Katalanisch, Chinesisch (vereinfach und Taiwanesisch), Kroatisch, Tschechisch, Dänisch, Niederländisch, Estnisch, Farsi, Finnisch, Französisch, Galizisch, Georgisch, Griechisch, Gujarati, Hebräisch, Hindi, Ungarisch, Isländisch, Indonesisch, Italienisch, Japanisch, Javanesisch, Lettisch, Kasachisch, Kanaresisch, Khmer, Koreanisch, Kurdisch, Kirgisisch, Lao, Litauisch, Mazedonisch, Malaiisch, Malayalam, Maltesisch, Marathi, Mongolisch, Nepalesisch, Norwegisch, Polnisch, Portugiesisch, Punjab, Rumänisch, Russisch, Serbisch, Singhalesisch, Slovakisch, Slowenisch, Suaheli, Schwedisch, Tagalog, Tadschikisch, Tamilisch, Telugu, Thailändisch, Türkisch, Ukrainisch, Urdu, Usbekisch und Vietnamesisch.