Tencent hat eine "Lite"-Version seines fortschrittlichen 3D-Generierungsmodells "Hunyuan World Model 1.0" veröffentlicht. Diese neue Variante wurde speziell für den Einsatz auf Consumer-Grafikkarten optimiert und reduziert den benötigten Grafikspeicher um etwa 35 Prozent, sodass sie bereits mit weniger als 17 Gigabyte VRAM lauffähig ist. Die Lite-Version verspricht zudem eine höhere Geschwindigkeit und einen geringeren Ressourcenverbrauch.
Hunyuan World Model 1.0: Tencent revolutioniert 3D-Welten-Generierung
Tencent hat mit dem "Hunyuan World Model 1.0" ein wegweisendes Open-Source-Modell vorgestellt, das die Erstellung immersiver 3D-Welten aus Text- oder Bildeingaben ermöglicht. Dieses Modell ist das erste seiner Art, das mit gängigen Grafikpipelines kompatibel ist und sich somit nahtlos in Game Engines, VR-Umgebungen und Simulationssoftware integrieren lässt. Ziel ist es, den kreativen Prozess von der Idee bis zum fertigen 3D-Inhalt zu beschleunigen und dabei auf offene Standards zu setzen.
Schlüsselfunktionen und Anwendungsbereiche
- Text- und Bildbasierte Generierung: Erzeugt virtuelle 3D-Szenen aus Textbeschreibungen ("Text-to-World") oder Bildern ("Image-to-World").
- Objekttrennung: Identifiziert und trennt erkennbare Objekte innerhalb einer Szene, was individuelle Bearbeitung und Interaktion ermöglicht.
- Separate Himmelbehandlung: Der Himmel wird separat verarbeitet und kann als realistische Umgebungslichtquelle dienen.
- Kompatibilität: Nahtlose Integration in gängige 3D-Workflows und Game Engines.
- Open Source: Frei verfügbar auf GitHub und Hugging Face.
Einschränkungen und Erweiterungsmöglichkeiten
Die generierten Umgebungen ähneln derzeit eher interaktiven 360-Grad-Panoramen, die eine begrenzte Navigation erlauben. Für vollständig begehbare 3D-Welten und längere, konsistente 3D-Videosequenzen ist das Zusatzmodul Voyager erforderlich. Tencent sieht die generierten Visualisierungen jedoch als wertvollen Ausgangspunkt für VR-Anwendungen und betont die Fähigkeit des Modells, komplexe Szenenbeschreibungen präzise in virtuelle Umgebungen zu übertragen.
Verfügbarkeit und Tencents Open-Source-Strategie
Die Lite-Version des "Hunyuan World Model 1.0" ist, wie das Originalmodell, quelloffen und über die interaktive Demo sceneTo3D, GitHub und Hugging Face zugänglich. Dies unterstreicht Tencents Engagement für eine offene KI-Strategie, die bereits die Veröffentlichung von Modellen wie Hunyuan3D 2.0 für Texturierung, HunyuanVideo für Videogenerierung und das Sprachmodell Hunyuan-A13B umfasst.