Google hat die Vorschauversionen seiner leichten KI-Modelle Gemini 2.5 Flash und Flash-Lite aktualisiert. Die neuen Versionen versprechen eine gesteigerte Effizienz, verbesserte Fähigkeiten im Umgang mit Multimedia und komplexeren Aufgaben sowie eine höhere Geschwindigkeit bei geringerem Tokenverbrauch. Dies führt zu Kosteneinsparungen für Nutzer, obwohl die Preise pro Token unverändert bleiben.
Key Takeaways
- Verbesserte Leistung und Geschwindigkeit bei geringerem Tokenverbrauch.
- Erweiterte Multimedia-Fähigkeiten, einschließlich präziserer Audio-Transkription und Bildanalyse.
- Bessere Handhabung komplexer Anweisungen und externer Tools.
- Einführung eines Alias-Systems für einfachere Modellverwaltung.
Gemini 2.5 Flash-Lite: Präziser und effizienter
Die aktualisierte Version von Gemini 2.5 Flash-Lite soll Anweisungen und Systemprompts "signifikant" zuverlässiger befolgen. Dies führt zu kürzeren und präziseren Antworten, was sowohl die Token-Kosten als auch die Latenz reduziert. Darüber hinaus wurden die Multimodalitätsfähigkeiten verbessert, was sich in einer präziseren Audiodaten-Transkription, robusterer Bildanalyse und höherer Übersetzungsqualität zeigt.
Gemini 2.5 Flash: Stärker bei komplexen Aufgaben
Das größere Gemini 2.5 Flash-Modell wurde ebenfalls überarbeitet. Es zeigt eine verbesserte Leistung bei der Nutzung externer Tools in komplexen, mehrstufigen Aufgaben. Laut Google konnte eine Verbesserung von fünf Prozentpunkten auf dem SWE-Bench Verified Benchmark erzielt werden, der die Fähigkeit zur Lösung realistischer Softwareentwicklungsaufgaben misst. Mit aktivierter „Thinking“-Funktion erzeugt das Modell qualitativ hochwertigere Ausgaben bei geringerer Token-Nutzung, was schnellere und günstigere Antworten ermöglicht.
Verfügbarkeit und Nutzung
Die neuen Flash-Modelle sind ab sofort in Google AI Studio und Vertex AI verfügbar. Das Lite-Modell kann über die Kennung gemini-2.5-flash-lite-preview-09-2025 und die Flash-Version über gemini-2.5-flash-preview-09-2025 getestet werden. Um die Nutzung zu vereinfachen, führt Google ein Alias-System ein. Die neuen Bezeichner gemini-flash-latest und gemini-flash-lite-latest verweisen stets auf die aktuellste Version eines Modells. Nutzer, die auf stabile Bedingungen angewiesen sind, sollten weiterhin die fest benannten Modelle verwenden, da sich hinter den Aliases Funktionen, Preise und Ratenlimits ändern können.
Preisgestaltung und Tokenverbrauch
Die Modelle bieten eine optimierte Token-Nutzung, was zu Kosteneinsparungen führt. Die Preise pro Million Eingabe-Token für Gemini 2.5 Flash liegen bei 0,30 USD (Text/Bild/Video) und 1,00 USD (Audio), während die Ausgabetoken 2,50 USD pro 1 Mio. kosten. Für Gemini 2.5 Flash-Lite sind die Kosten mit 0,10 USD (Text/Bild/Video), 0,30 USD (Audio) und 0,40 USD (Ausgabe) pro 1 Mio. Token deutlich geringer. Für die Batch-API gelten jeweils 50 Prozent der interaktiven Preise.