Google hat das neue Large Language Model 'Gemini' vorgestellt. Es ist bsonders leistungsfähig, in drei verschiedenen Ausbaustufen verfügbar und kommt in Google Bard bereits zur Anwendung.
Diese Neuheit könnte vieles bisher Dagewesene alt aussehen lassen: Google hat sein neues Large Language Modell 'Gemini' vorgestellt. Gemini ist multimodal. Das bedeutet: Es kann generalisieren und nahtlos unterschiedliche Arten von Inhalten verstehen. Dazu gehören Text, Code, Bilder und Videos sowie Audio.
Drei Ausbaustufen von Gemini
Gemini ist so flexibel, dass es in verschiedenen Umgebungen läuft: vom Rechenzentrum bis zum Smartphone. Es gibt drei unterschiedliche Größen:
- Gemini Ultra: das größte Modell für sehr komplexe Aufgaben
- Gemini Pro: das laut Google beste Modell zur Skalierung für eine große Bandbreite von Aufgaben
- Gemini Nano: effizientes Modell für Aufgaben direkt auf dem Endgerät
Gemini schlägt GPT-4
Gemini erzielt in verschiedenen Benchmarks Top-Leistungen und ist laut Google als erstes Modell in der Lage, menschliche Experten im Bereich MMLU (massice multitask language understanding) zu übertreffen. Zum Testen wurden 57 Themen aus den Bereichen Mathematik, Physik, Geschichte, Jura, Medizin und Ethik kombiniert, um sowohl Allgemeinwissen als auch die Fähigkeiten zum Lösen von Problemen zu testen.
Gemini ist in der Lage, vor dem Erstellen von Antworten auf schwierige Fragen sorgfältiger „nachzudenken“, was laut Google zu deutlichen Verbesserungen im Vergleich zur Verwendung der erstbesten Antwort führt.
Im Vergleich zu GPT-4 kann Gemini in sieben von acht Disziplinen punkten. GPT-4 ist lediglich im sogenannten HellaSwag-Test besser. Dabei geht es um logisches Denken im Bereich von Alltagsproblemen.
Im Lösen von multimodalen Problemen mit Verwendung von Bildern, Video oder Audio schlägt Gemini GPT-4 in allen Disziplinen. Das liegt auch daran, dass Gemini von Natur aus multimodal ist. Andere LLMs werden für verschiedene Medien separat trainiert, um diese dann zusammenzuführen. Gemini wird von Anfang an multimodal trainiert. Dabei ist Gemini in der Lage, auch komplexe geschriebene und visuelle Informationen zu verarbeiten.
Gemini kann außerdem hochwertigen Programmcode in den wichtigsten Programmiersprachen wie Python, Java, C++ und Go verstehen, erklären und erzeugen. Dabei überzeugt Gemini laut Google in verschiedenen Code-Benchmarks wie zum Beispiel HumanEval und Natural2Code.
Sie benötigen SEO-Beratung für Ihre Website?
Trainiert auf TPUs
Google Gemini 1.0 wurde auf einer KI-optimierten Infrastruktur trainiert. Dabei wurden die von Google entwickelten Tensor Processing Units (TPUs) in Version 4 und 5 verwendet. Auf diesen Rechnern läuft Gemini deutlich schneller als frühere, kleinere und weniger leistungsfähige Modelle.
In diesem Zusammenhang stellt Google das bisher leistungsfähigste, effizienteste und am besten skalierbare TPU-System vor, Cloud TPU v5p, das speziell für besonders leistungsfähige KI-Modelle ausgelegt ist.
Sicherheitsaspekte von Gemini
Google hat bei Gemini auch auf die Sicherheit geachtet und sorgt nach eigener Aussage dafür, dass Beeinflussungen (Bias), die zu fehlerhaften Ergebnissen führen könnten, reduziert wurden. Mithilfe passender Klassifikatoren sollen negative Stereotype oder Gewaltinhalte aussortiert werden.
In welchen Google Produkten wird Gemini verwendet?
Ab heute wird Google Bard die Variante Gemini Pro verwenden, also die mittlere Variante des Modells. Das ist laut Google das größte Update für Bard seit dessen Start.
Gemini soll auch auf den Google Pixel Smartphones zum Einsatz kommen. Das Pixel 8 Pro ist das erste Smartphone, das für die Verwendung von Gemini Nano entwickelt wurde.
In den nächsten Monaten soll Gemini Pro auch in der Suche, in Google Ads, Chrome und Duet AI zur Anwendung kommen.
In Google SGE wird Gemini schon verwendet und sorgt dort für bis zu 40 Prozent schnellere Antworten.
Bard Advanced wird Gemini Ultra verwenden
Gemini Ultra, das leistungsstärkste Modell der Serie, soll ebenfalls bald verfügbar sein. Derzeit werden noch einige Sicherheitschecks durchgeführt. Ausgewählte Nutzer sollen Zugriff auf Gemini Ultra erhalten.
Im kommenden Jahr wird es mit Bard Advanced eine besonders leistungsfähige Version des Chatbots geben, die auf Gemini Ultra basiert.