OpenAI hat mit Sora 2 einen bedeutenden Sprung in der KI-gestützten Videoerstellung angekündigt. Das neue Modell generiert nicht nur physikalisch realistischere Videos, sondern integriert erstmals auch hochwertigen Sound. Parallel dazu startet eine neue Social-App, die den Austausch und die kreative Nutzung dieser KI-generierten Inhalte in den Vordergrund stellt. Die App ist nun auch für Android-Nutzer verfügbar.
Wichtige Neuerungen im Überblick
- Sora 2 bietet verbesserte physikalische Simulationen und Konsistenz über mehrere Szenen hinweg.
- Erstmals wird auch die Generierung von authentischem Sound, Sprache und Soundeffekten unterstützt.
- Eine neue "Cameo"-Funktion ermöglicht es Nutzern, sich selbst oder eigene Charaktere in KI-generierte Videos einzufügen.
- Eine begleitende Social-App fördert kreativen Austausch und Remixing von Inhalten.
- Die Sora-App ist nun auch für Android in ausgewählten Ländern verfügbar.
Sora 2: Ein "GPT-3.5-Moment" für Video
OpenAI stuft den Sprung zu Sora 2 intern als "GPT-3.5-Moment" für Videomodelle ein. Dies signalisiert, dass die Technologie von einem experimentellen Stadium in den Bereich der praktischen Nutzbarkeit übergegangen ist. Das Modell kann komplexe physikalische Abläufe präzise simulieren, wie etwa die korrekte Ballphysik beim Basketball oder die Dynamik gymnastischer Bewegungen. Im Gegensatz zu früheren Modellen, die Objekte verzerren oder teleportieren konnten, zeigt Sora 2 ein besseres Verständnis für physikalische Interaktionen.
Kontrolle, Konsistenz und Klang
Sora 2 zeichnet sich durch die Fähigkeit aus, komplexe, mehrteilige Anweisungen über mehrere Szenen hinweg konsistent umzusetzen. Das Modell unterstützt verschiedene visuelle Stile, von realistisch bis hin zu Anime-Ästhetik. Eine bahnbrechende Neuerung ist die Integration von authentisch klingenden Hintergrundgeräuschen, Sprache und Soundeffekten, die synchron zu den generierten Bildern sind.
Personalisierte "Cameos" und Datenschutz
Eine herausragende Funktion ist die "Cameo"-Option, die es Nutzern erlaubt, ihre eigene Erscheinung und Stimme in KI-generierte Videos einzufügen. OpenAI betont, dass die Nutzer die volle Kontrolle über ihre Cameos behalten. Nur autorisierte Personen können diese nutzen, und alle Videos, in denen ein Cameo erscheint, sind für den Ersteller jederzeit einsehbar. Zusätzliche Schutzmaßnahmen sind für jugendliche Nutzer implementiert, und die Erstellung von Deepfakes bekannter Personen wird unterbunden, es sei denn, es liegt eine explizite Zustimmung vor.
Die Sora-App: Kreativer Austausch für Android und iOS
Die Sora-App, die zunächst für iOS gestartet wurde, ist nun auch für Android-Nutzer in Ländern wie Kanada, Japan, Korea, Taiwan, Thailand, den USA und Vietnam verfügbar. Die App ist auf sozialen Austausch ausgelegt und ermöglicht das Erstellen eigener Videos, das Remixen von Inhalten anderer und das Durchstöbern eines personalisierten Feeds. Die Nutzung ist derzeit kostenlos, wobei OpenAI angibt, dass der Betrieb unwirtschaftlich ist und sich dies ändern wird. Die App soll kreatives Gestalten fördern und nicht auf maximale Verweildauer optimiert sein.
Zukünftige Entwicklungen
OpenAI plant die Einführung einer API und arbeitet an einem "Sora 2 Pro"-Modell, das zunächst eingeladenen Nutzern vorbehalten ist. Das Unternehmen sieht in Sora 2 einen wichtigen Schritt in Richtung genereller Welt-Simulatoren für KI-Systeme.