Das chinesische KI-Startup Deepseek hat mit der Veröffentlichung seines neuen Sprachmodells Deepseek-V3.2-Exp für Aufsehen gesorgt. Das Modell bietet eine verbesserte Effizienz bei der Verarbeitung langer Kontexte und wird zu Preisen angeboten, die bis zu 75 Prozent unter denen des Vorgängers liegen. Diese strategische Preisgestaltung könnte den Wettbewerb im KI-Markt erheblich beeinflussen.
Wichtige Erkenntnisse
- Deepseek-V3.2-Exp führt eine neue, effizientere Attention-Architektur (DSA) für lange Kontexte ein.
- Die API-Preise wurden um 50 bis 75 Prozent gesenkt, was die Kosten für Nutzer drastisch reduziert.
- Das Modell unterstützt chinesische KI-Chips und zielt auf eine strategische Unabhängigkeit von US-Herstellern ab.
- Die Leistung bleibt weitgehend auf dem Niveau des Vorgängers V3.1-Terminus.
Effizienzsteigerung durch neue Architekturen
Deepseek-V3.2-Exp basiert auf dem Vorgängermodell V3.1-Terminus und integriert die DeepSeek Sparse Attention (DSA). Diese Neuerung ermöglicht eine selektive Verarbeitung von Kontextteilen, was die Inferenzkosten bei sehr langen Eingaben (bis zu 128.000 Tokens) signifikant senkt. Laut Unternehmensangaben sind die Kosten für das Prefilling etwa 3,5-mal niedriger und für das Decoding sogar 6- bis 7-mal niedriger.
Zusätzlich setzt Deepseek auf TileLang, ein High-Level-Programmiermodell, das die Kompatibilität mit verschiedenen Hardware-Plattformen sicherstellt. Dies ermöglicht den Einsatz auf KI-Chips chinesischer Hersteller wie Huawei Ascend und Cambricon, was die strategische Ausrichtung des Unternehmens unterstreicht, die Abhängigkeit von US-amerikanischen KI-Chips zu verringern.
Leistung und Preisgestaltung
In Benchmarks zeigt sich Deepseek-V3.2-Exp auf Augenhöhe mit V3.1-Terminus. Zwar gibt es in einzelnen Tests leichte Schwankungen, die das Unternehmen auf eine Tendenz zu kürzeren Antworten bei rechenintensiven Aufgaben zurückführt, doch bei vergleichbarer Tokenlänge schließt sich diese Lücke. Die Hauptattraktion liegt jedoch in der Kostensenkung: Die API-Preise wurden drastisch reduziert.
| Merkmal | Neuer Preis (pro 1 Mio. Tokens) | Alter Preis (pro 1 Mio. Tokens) | Reduktion |
|---|---|---|---|
| Input (Cache Hit) | 0,028 US-Dollar | 0,07 US-Dollar | -60% |
| Input (Cache Miss) | 0,28 US-Dollar | 0,56 US-Dollar | -50% |
| Output | 0,42 US-Dollar | 1,68 US-Dollar | -75% |
Diese Preispolitik setzt westliche Anbieter, insbesondere Anthropic, unter Druck, die ähnliche Modelle zu deutlich höheren Preisen anbieten.
Verfügbarkeit
Deepseek-V3.2-Exp ist ab sofort über verschiedene Kanäle zugänglich. Eine Web-Oberfläche und mobile Apps für iOS und Android stehen zur Verfügung. Entwickler können das Modell über die API in ihre Anwendungen integrieren, und die Modell-Checkpoints sind auf Hugging Face zum Download verfügbar. Das Vorgängermodell V3.1-Terminus bleibt bis zum 15. Oktober 2025 über eine temporäre API erreichbar.