Google hat mit Gemini 3 seine neueste Generation von KI-Modellen vorgestellt und beansprucht, das bisher "intelligenteste Modell" des Unternehmens zu sein. Die neue Reihe zielt darauf ab, neue Standards in den Bereichen logisches Denken, multimodales Verständnis und Agenten-Fähigkeiten zu setzen. Gemini 3 Pro ist ab sofort als Preview verfügbar und wird schrittweise in verschiedene Google-Produkte integriert, darunter die Gemini-App, Entwickler-Tools und der KI-Modus der Google-Suche.
Key Takeaways
- Gemini 3 Pro übertrifft in zahlreichen Benchmarks die Konkurrenz, einschließlich xAIs Grok 4.1 und OpenAIs GPT-5.1.
- Das Modell zeigt native multimodale Fähigkeiten und erzielt Spitzenwerte bei der Verarbeitung von Text, Bildern, Videos und Audio.
- Ein neuer "Deep Think"-Modus verspricht nochmals gesteigerte Denk- und Verständnisfähigkeiten für komplexe Aufgaben.
- Google führt "Antigravity" ein, eine neue Plattform für die Entwicklung von KI-Agenten.
- Trotz Spitzenleistung sind die Kosten für Gemini 3 Pro im Vergleich zu seinem Vorgänger gestiegen, insbesondere bei größeren Kontextfenstern.
Verbesserte Denkfähigkeiten und Benchmark-Rekorde
Google untermauert die Leistungsfähigkeit von Gemini 3 Pro mit beeindruckenden Benchmark-Ergebnissen. Das Modell führt die LMArena-Rangliste an und zeigt Denkfähigkeiten auf "PhD-Niveau" in Tests wie Humanity’s Last Exam und GPQA Diamond. Damit positioniert es sich auch vor xAIs Grok 4.1. Neue Spitzenwerte werden zudem in den Bereichen Mathematik und multimodales Verständnis erreicht.
Die technische Grundlage bildet eine "sparse mixture-of-experts" (MoE) Transformer-Architektur, trainiert auf einem umfangreichen, multimodalen Datensatz. Der Wissensstand des Modells reicht bis Januar 2025.
Starke multimodale Fähigkeiten
Ein herausragendes Merkmal von Gemini 3 ist seine native multimodale Fähigkeit, die Verarbeitung von Text, Bildern, Videos und Audio umfasst. Bei MMMU-Pro und Video-MMMU erzielt das Modell Spitzenwerte. Besonders beeindruckend ist die Leistung bei der Analyse grafischer Benutzeroberflächen im ScreenSpot-Pro-Benchmark, wo Gemini 3 Pro den bisherigen Spitzenreiter Holo2 deutlich übertrifft und auch Claude 4.5 Sonnet und GPT-5.1 weit hinter sich lässt.
Diese Fähigkeiten eröffnen praktische Anwendungen, wie die Analyse von Sportvideos zur Technikverbesserung oder die Generierung von Code für komplexe Visualisierungen. In der Google-Suche soll Gemini 3 neue "immersive visuelle Layouts" generieren und als Browser-Agent in Chrome zuverlässiger agieren.
"Deep Think" und Agenten-Plattform "Antigravity"
Zusätzlich zu Gemini 3 Pro führt Google den "Deep Think"-Modus ein, der die Denk- und Verständnisfähigkeiten für besonders komplexe Probleme weiter steigert. Dieser Modus wird zunächst Sicherheitstestern und später Abonnenten von Google AI Ultra zur Verfügung gestellt.
Für Entwickler präsentiert Google mit Google Antigravity eine neue "agentische Entwicklungsplattform". Diese Plattform soll KI-Agenten direkten Zugriff auf Editor, Terminal und Browser ermöglichen, um komplexe Software-Aufgaben autonom zu planen, auszuführen und zu validieren.
Analysten sehen Gemini 3 als neuen Marktführer
Unabhängige Tests scheinen die Behauptungen von Google zu stützen. Laut dem Analysehaus Artificial Analysis ist Gemini 3 Pro der neue Marktführer und übertrifft OpenAIs GPT-5.1 im "Artificial Analysis Intelligence Index". Das Modell nimmt in mehreren zentralen Benchmarks die Spitzenposition ein, insbesondere bei Codierungs-, Agenten- und multimodalen Aufgaben.
Allerdings hat die Spitzenleistung ihren Preis. Die Kosten für Gemini 3 Pro liegen für Kontexte unter 200.000 Token bei 2 US-Dollar pro Million Input-Token und 12 US-Dollar pro Million Output-Token, was teurer ist als bei seinem Vorgänger und GPT-5.1. Für größere Kontexte steigen die Kosten weiter an. Trotzdem positioniert sich Google preislich unterhalb anderer Hochleistungsmodelle wie Claude 4.5 Sonnet und Grok 4.1. Eine differenzierte Bewertung zeigt zwar eine hohe Wissensgenauigkeit, aber auch eine "höhere Halluzinationsrate als andere Modelle".