Alibabas KI-Einheit Qwen hat eine bedeutende Erweiterung ihres Modellportfolios angekündigt. Die neuen Veröffentlichungen umfassen fortschrittliche Modelle für Text-zu-Sprache-Synthese, Bildbearbeitung und Inhaltsmoderation, die darauf abzielen, die Interaktion mit künstlicher Intelligenz natürlicher, vielseitiger und sicherer zu gestalten.
Sprachmodell Qwen3-TTS-Flash
Das neue Sprachmodell Qwen3-TTS-Flash ist in der Lage, natürliche Sprache in zehn verschiedenen Sprachen zu generieren, darunter Chinesisch, Englisch, Italienisch und Französisch. Mit 17 verfügbaren Stimmen und Unterstützung für neun chinesische Dialekte verspricht Alibaba eine beeindruckende Sprachausgabe, die nach nur 97 Millisekunden geliefert wird.
Bildbearbeitungsmodell Qwen-Image-Edit-2509
Qwen-Image-Edit-2509 stellt ein signifikantes Update für das Bildbearbeitungsmodell dar. Es zeichnet sich durch verbesserte Konsistenz bei der Bearbeitung von Gesichtern, Produkten und Text aus. Das Modell unterstützt mehrere Eingabebilder und kann mit Kontrollkarten wie Tiefen- oder Kantenkarten arbeiten, was präzisere Bearbeitungen ermöglicht. Nutzer können die Fähigkeiten dieses Modells auch direkt in Qwen Chat testen.
Sicherheitsmodell Qwen3Guard
Mit Qwen3Guard bringt Qwen ein neues Sicherheitsmodell auf den Markt, das in drei Größen (0,6B, 4B, 8B) erhältlich ist. Dieses Modell kann Inhalte in 119 Sprachen bewerten und problematische Inhalte in Echtzeit (Qwen3Guard-Stream) oder im Gesamtzusammenhang (Qwen3Guard-Gen) erkennen. Es klassifiziert Inhalte als sicher, kontrovers oder unsicher, was eine effektive Inhaltsmoderation ermöglicht.
Weitere Neuerungen
Zusätzlich zu diesen Hauptmodellen hat Qwen eine schnellere Version von Qwen3-Next sowie das multimodale Modell Qwen3-Omni veröffentlicht, was das breite Spektrum der neuen KI-Entwicklungen unterstreicht.