Anthropic hat sein neuestes Sprachmodell, Claude Sonnet 4.5, vorgestellt. Dieses Modell setzt neue Maßstäbe in der KI-Entwicklung, insbesondere im Bereich der Softwareentwicklung und Aufgabenautomatisierung. Mit einer bemerkenswerten Fähigkeit, über lange Zeiträume hinweg fokussiert zu arbeiten, verspricht Sonnet 4.5 eine deutliche Steigerung der Produktivität bei komplexen Aufgaben.
Key Takeaways
- Claude Sonnet 4.5 übertrifft frühere Modelle, einschließlich Claude Opus 4.1, in Benchmarks für Softwareentwicklung.
- Das Modell kann Berichten zufolge bis zu 30 Stunden am Stück an komplexen Aufgaben arbeiten.
- Verbesserungen zeigen sich auch in der Computerbedienung und der Fähigkeit, reale Computersysteme zu steuern.
- Das Claude-Agent-SDK wird veröffentlicht, um die Entwicklung eigener KI-Agenten zu erleichtern.
Verbesserte Leistung bei Code und Ausdauer
Anthropic positioniert Claude Sonnet 4.5 als ihr bisher leistungsstärkstes Sprachmodell. Es soll insbesondere bei Softwareentwicklung, Computerbedienung und Aufgabenautomatisierung glänzen. Interne Tests deuten darauf hin, dass Sonnet 4.5 in der Lage ist, über 30 Stunden fokussiert an komplexen Aufgaben zu arbeiten, was eine signifikante Steigerung der Ausdauer darstellt.
Im SWE-bench Verified Benchmark, der reale Programmieraufgaben bewertet, erzielt Sonnet 4.5 laut Anthropic die besten Ergebnisse aller getesteten Modelle. Dies unterstreicht die Fortschritte im Bereich der Code-Generierung und -Verständnis.
Fortschritte in der Computerbedienung
Auch die Fähigkeit zur Bedienung realer Computersysteme wurde erheblich verbessert. Im OSWorld-Benchmark erreicht Sonnet 4.5 einen Spitzenwert von 61,4 Prozent, ein deutlicher Sprung gegenüber dem Vorgängermodell Sonnet 4, das bei 42,2 Prozent lag. Dies ermöglicht fortschrittlichere Automatisierungsaufgaben, wie das Ausfüllen von Formularen, wie in einer Demonstration mit einer Chrome-Erweiterung gezeigt wurde.
Erweiterte Fähigkeiten und Verfügbarkeit
Neben Programmier- und Computerfähigkeiten hat Sonnet 4.5 auch in Bereichen wie Mathematik, logischem Denken und fachspezifischem Wissen zugelegt. Anthropic empfiehlt das Modell für eine breite Palette von Anwendungsszenarien. Claude Sonnet 4.5 ist ab sofort über die Claude-API verfügbar. Die Preise bleiben unverändert bei 3 bzw. 15 US-Dollar pro Million Tokens.
Neue Werkzeuge für Entwickler
Parallel zum Modell-Update erhält das Entwicklungswerkzeug Claude Code neue Funktionen, darunter Checkpoints zum Speichern und Zurücksetzen von Aufgabenständen sowie eine überarbeitete Terminal-Oberfläche und eine native VS-Code-Extension. Mit dem Claude-Agent-SDK stellt Anthropic erstmals die Infrastruktur für die Entwicklung eigener KI-Agenten öffentlich zur Verfügung. Dieses SDK soll die Verwaltung von Langzeitaufgaben, Berechtigungssysteme und die Koordination mehrerer Subagenten vereinfachen.