Das chinesische KI-Unternehmen Deepseek hat mit Deepseek V3.2 ein neues Sprachmodell präsentiert, das in zahlreichen Tests mit GPT-5 konkurrieren soll. Im Bereich des sogenannten „Reasoning“ wird erwartet, dass es Googles neues Gemini 3 Pro übertrifft.
Die Forscher von Deepseek haben drei wesentliche Schwächen aktueller Open-Source-Modelle identifiziert: die ineffiziente Verarbeitung langer Texte, unzureichende Investitionen in das Posttraining und begrenzte Fähigkeiten bei autonomen Agentenaufgaben.
Deepseek V3.2 soll diese Herausforderungen durch eine neuartige Aufmerksamkeitsarchitektur und ein signifikant erweitertes Posttraining adressieren, wie im kürzlich veröffentlichten technischen Bericht zu V3.2 dargelegt wird. Im September hatte Deepseek bereits eine vorläufige Version unter dem Namen V3.2-Exp vorgestellt.
Bildquelle: Unsplash / Sabbir Hossain