90 Prozent Befolgung von Anweisungen: Google optimiert Audiomodelle

90 Prozent Befolgung von Anweisungen: Google optimiert Audiomodelle

Update für Gemini 2.5 Flash Native Audio

Google hat ein Update für Gemini 2.5 Flash Native Audio veröffentlicht, das Sprachassistenten verbessern soll. Das Modell kann nun komplexe Arbeitsabläufe besser bewältigen, Nutzeranweisungen präziser umsetzen und natürlichere Gespräche führen. Die Befolgung von Entwickleranweisungen stieg von 84 auf 90 Prozent. Auch die Gesprächsqualität in mehrstufigen Unterhaltungen wurde verbessert.

Leistungsdaten und Benchmark-Ergebnisse

Laut Google erreicht das neue Audiomodell bei Funktionsaufrufen 71,5 Prozent Genauigkeit auf dem ComplexFuncBench-Benchmark und liegt damit vor OpenAIs gpt-realtime (66,5 Prozent); allerdings wurde hier wohl nicht gegen die neueste Realtime-Version getestet, die erst gestern erschien.

Verfügbarkeit der Technologie

Das Update ist in Google AI Studio, Vertex AI, Gemini Live und Search Live verfügbar. Google-Cloud-Kunden nutzen die Technologie bereits. Entwickler können das Modell über die Gemini-API testen.

Bildquelle: ai-generated

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

You May Also Like