KI-Modell mit verbesserten agentischen Prozessen

Deepseek V3.1-Terminus: KI-Modell mit verbesserten agentischen Prozessen und aggressiver Preisgestaltung

Deepseek hat sein Hybrid-KI-Modell Deepseek-V3.1 mit der neuen Version V3.1-Terminus aktualisiert. Dieses Update zielt darauf ab, Schwächen der Vorgängerversion zu beheben, wie inkonsistente Sprache und instabile Ausgaben, und verbessert die Leistung bei agentischen Prozessen. Das Modell bietet eine zuverlässigere Unterscheidung zwischen Chinesisch und Englisch und generiert keine fehlerhaften Sonderzeichen mehr. Die Leistung der integrierten Agenten, einschließlich Code- und Suchagenten, wurde ebenfalls überarbeitet.

Key Takeaways

  • Verbesserte Konsistenz und Zuverlässigkeit der Ausgaben.
  • Deutliche Leistungssteigerung bei Aufgaben mit Tool-Nutzung.
  • Aggressive Preisstrategie macht das Modell wettbewerbsfähig.
  • Unterstützung für zwei Denkmodi und ein großes Kontextfenster.

Leistungsverbesserungen und Benchmarks

V3.1-Terminus zeigt in Benchmarks insbesondere bei Aufgaben, die eine Tool-Nutzung erfordern, deutliche Verbesserungen. Im BrowseComp-Benchmark stieg die Punktzahl von 30,0 auf 38,5, während im Terminal-Benchmark eine Verbesserung von 31,3 auf 36,7 erzielt wurde. Bei Reasoning-Aufgaben ohne Tool-Nutzung blieben die Unterschiede gering.

Architektur und Trainingsdaten

Das Modell basiert auf Deepseek-V3.1 und kombiniert zwei Betriebsmodi: einen "denkenden" Modus (Deepseek-reasoner) für komplexe Aufgaben mit Tool-Nutzung und einen "nicht-denkenden" Modus (Deepseek-chat) für einfachere Konversationen. Beide Modi unterstützen ein Kontextfenster von bis zu 128.000 Tokens. Das Training wurde mit 840 Milliarden zusätzlichen Tokens, einem neuen Tokenizer-Setup und überarbeiteten Prompt-Vorlagen ergänzt.

Preisgestaltung und Zugänglichkeit

Deepseek verfolgt eine aggressive Preisstrategie. Die Ausgabe von Tokens kostet 1,68 US-Dollar pro Million Tokens, was deutlich günstiger ist als bei Konkurrenzmodellen wie GPT-5 oder Claude Opus 4.1. Die Input-API ist mit 0,07 US-Dollar pro Million Tokens bei Cache-Treffern und 0,56 US-Dollar bei Cache-Fehlschlägen ebenfalls preislich attraktiv. Das Modell ist über App, Web und API zugänglich, und die Open-Source-Gewichte sind unter einer MIT-Lizenz auf Hugging Face verfügbar.

Einschränkungen und staatliche Zensur

Wie andere chinesische KI-Modelle unterliegt auch Deepseek-V3.1-Terminus der staatlichen Zensur in China. Dies kann insbesondere bei politischen Themen zu Einschränkungen führen und das Modell zu einem Propagandainstrument der chinesischen Regierung machen. Solche Eingriffe können sich auch auf die Performance auswirken, wie ein kürzlicher Coding-Review von Deepseek gezeigt hat.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

You May Also Like