Google hat seine Gemini-App mit der neuesten Version Veo 3.1 aktualisiert und führt eine innovative Mehrbild-Steuerung für die Erstellung von KI-Videos ein. Diese Neuerung ermöglicht es Nutzern, mehrere Referenzbilder hochzuladen, die dann in Kombination mit einem Text-Prompt zur Generierung von Video und Audio verwendet werden. Dies bietet eine deutlich verbesserte Kontrolle über die Ergebnisse des Videomodells.
Wichtige Neuerungen im Überblick
- Mehrbild-Steuerung: Nutzer können nun mehrere Referenzbilder für die Videoerstellung hochladen.
- Verbesserte KI-Modelle: Veo 3.1 bietet realistischere Texturen, höhere Eingabetreue und bessere Audioqualität.
- Erprobte Technologie: Die Funktion basiert auf Googles erweiterter Video-KI-Plattform Flow.
Präzisere Videogenerierung durch Referenzbilder
Die neue Funktion in der Gemini-App erlaubt es Anwendern, die Videoerstellung durch die Bereitstellung mehrerer Referenzbilder zu steuern. Diese Bilder dienen als Grundlage, auf der das KI-Modell aufbaut, um sowohl das Video als auch den begleitenden Ton zu generieren. In Verbindung mit einem detaillierten Text-Prompt erhalten Nutzer so eine wesentlich präzisere Kontrolle über das Endergebnis. Diese Methode wurde bereits in Googles erweiterter Video-KI-Plattform Flow getestet, die auch Funktionen wie das Verlängern von Clips und das nahtlose Zusammensetzen mehrerer Szenen bietet.
Veo 3.1: Fortschritte in Qualität und Realismus
Die zugrundeliegende Technologie, Veo 3.1, ist seit Mitte Oktober verfügbar und markiert einen signifikanten Fortschritt gegenüber der Vorgängerversion Veo 3.0. Laut Google zeichnet sich Veo 3.1 durch realistischere Texturen, eine höhere Treue zu den Eingaben und eine verbesserte Audioqualität aus. Diese Verbesserungen tragen dazu bei, dass die generierten Videos lebensechter und überzeugender wirken. Die Gemini-App profitiert somit direkt von diesen technologischen Fortschritten, auch wenn die Plattform Flow ein etwas höheres Videokontingent bietet.