Warum Alibabas neues Qwen-Modell realistischere Bilder erzeugt

Warum Alibabas neues Qwen-Modell realistischere Bilder erzeugt

Alibaba hat Qwen-Image-2512 vorgestellt, ein aktualisiertes Text-zu-Bild-Modell, das darauf abzielt, realistischere Darstellungen von Personen zu generieren. Laut Angaben von Alibaba liefert das Modell Bilder mit einer höheren Detailgenauigkeit der Gesichter und reduziert den künstlichen Look, der zuvor charakteristisch war.

Das Update des Bildmodells soll den sogenannten „Plastik“-Look des Vorgängermodells eliminieren. Zudem verbessert sich die Darstellung von Schrift in Bildern, was insbesondere bei Infografiken oder Präsentationen von Bedeutung ist. Auch die Abbildung von Landschaften, Tierfell und anderen natürlichen Elementen wird verfeinert.

Zusätzlich wird beim Text-Rendering im neuen Qwen-Modell eine bessere Leistung versprochen. In über 10.000 Blindtests auf der AI Arena-Plattform von Alibaba erzielte Qwen-Image-2512 den vierten Platz und gilt damit als das leistungsstärkste Open-Source-Modell in diesem Segment. Es tritt in Konkurrenz zu anderen Modellen wie HunyuanImage-3.0, Z-image oder Flux.2.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

You May Also Like