Das chinesische KI-Unternehmen Zhipu AI hat mit GLM-4.5 und GLM-4.5V neue Open-Source-Sprachmodelle vorgestellt, die logisches Denken, Programmierung und agentische Aufgaben vereinen. Die Modelle demonstrieren beeindruckende Fähigkeiten, wie die Erstellung interaktiver Spiele, die Generierung von Präsentationen durch Web-Suche und die Entwicklung vollständiger Web-Anwendungen.
Neue Maßstäbe durch Open-Source-Modelle
Zhipu AI hat mit der Veröffentlichung von GLM-4.5 und GLM-4.5V die Messlatte für Open-Source-Sprachmodelle höher gelegt. Diese Modelle sind darauf ausgelegt, komplexe Aufgaben zu bewältigen, die logisches Denken, Programmierung und die Ausführung agentischer Aufgaben erfordern. Die praktische Anwendbarkeit wird durch Demos wie die Erstellung eines "Flappy Bird"-Spiels in einer einzigen HTML-Seite oder die Generierung von Präsentationsfolien mit autonomer Web-Suche unterstrichen.
Multimodale Fähigkeiten und hybrider Ansatz
Die multimodale Version, GLM-4.5V, erweitert die Funktionalität um die Analyse von Bildern und Videos. Sie kann Webseiten aus Screenshots nachbauen und Bildschirmoperationen für autonome Agenten durchführen. Diese fortschrittlichen Funktionen können über die ChatGPT-ähnliche Oberfläche chat.z.ai kostenlos ausprobiert werden. Zhipu AI bietet insgesamt drei Varianten an: GLM-4.5, die kompaktere Version GLM-4.5-Air und das multimodale GLM-4.5V. Alle Modelle verfolgen einen hybriden Ansatz mit zwei Modi: einem "Denk-Modus" für detaillierte Begründungen bei komplexen Aufgaben und einem "Schnellantwort-Modus" für sofortige Ergebnisse.
Starke Leistung trotz geringerer Parameterzahl
- GLM-4.5 erzielt laut Zhipu AI eine Spitzenleistung unter Open-Source-Modellen gleicher Größe.
- In Tests auf zwölf Benchmarks belegt GLM-4.5 den dritten Platz im Gesamtranking und den zweiten Platz bei autonomen Aufgaben.
- Besonders hervorzuheben ist die Parameter-Effizienz: GLM-4.5 hat nur halb so viele Parameter wie Deepseek-R1, erreicht aber vergleichbare oder bessere Leistungen.
- Bei der Web-Navigation übertrifft GLM-4.5 mit 26,4 Prozent auf BrowseComp sogar das Modell Claude Opus 4.
Tiefere Architektur für verbesserte Denkfähigkeiten
GLM-4.5 basiert auf einer Mixture-of-Experts-Architektur mit insgesamt 355 Milliarden Parametern, wovon 32 Milliarden aktiv sind. Die kompaktere GLM-4.5-Air-Version verfügt über 106 Milliarden Gesamtparameter und 12 Milliarden aktive Parameter. GLM-4.5V baut auf GLM-4.5-Air auf. Im Gegensatz zu anderen Modellen setzt Zhipu AI auf mehr Schichten statt auf breitere Schichten mit mehr Parametern pro Schicht, was sich positiv auf die Denkfähigkeiten auswirkt. Das Training umfasste rund 23 Billionen Token und erfolgte in mehreren Phasen, beginnend mit allgemeinen Daten und fortgesetzt mit spezialisierten Code- und Denkaufgaben.
Zhipu AI: Aufstieg zum KI-Giganten
Alle Modelle sind über die Z.ai-Plattform zugänglich und bieten OpenAI-kompatible API-Schnittstellen. Der Quellcode ist auf Github verfügbar, und die Modellgewichte sind auf Hugging Face und Alibabas Modelscope zu finden. Zhipu AI, gegründet 2019 von Professoren der Tsinghua-Universität, hat sich zu einem der führenden chinesischen KI-Start-ups entwickelt. Mit über 800 Mitarbeitern, einem starken Fokus auf Forschung und Entwicklung sowie bedeutenden Investitionen von Tech-Giganten wie Alibaba, Tencent und Xiaomi, wird das Unternehmen auf über fünf Milliarden US-Dollar geschätzt. Zhipu AI zeichnet sich durch ein stark akademisch geprägtes Team und unabhängige Forschung aus und plant einen Börsengang.