OpenAI hat eine spezialisierte Version von GPT-5 für die Softwareentwicklung vorgestellt: GPT-5-Codex. Dieses neue Modell ist darauf ausgelegt, komplexe Programmieraufgaben autonom zu lösen, Software zu überprüfen und Entwickler bei einer Vielzahl von Aufgaben zu unterstützen, von der Fehlerbehebung bis zur Code-Optimierung.
Wichtige Neuerungen
- GPT-5-Codex ist eine für Softwareentwicklung optimierte Variante von GPT-5.
- Es kann Aufgaben wie Refactoring, Testgenerierung und Bugfixing eigenständig durchführen.
- Das Modell zeigt in Benchmarks bessere Ergebnisse als das Standard-GPT-5.
- Es integriert sich nahtlos in gängige Entwicklungsumgebungen wie IDEs und GitHub.
Verbesserte Leistung bei Programmieraufgaben
GPT-5-Codex wurde speziell für reale Entwicklungsaufgaben trainiert und übertrifft in standardisierten Tests das allgemeine GPT-5-Modell. Bei der SWE-bench Verified Benchmark-Suite erreicht GPT-5-Codex eine Genauigkeit von 74,5 %, während GPT-5 bei 72,8 % liegt. Insbesondere bei Refactoring-Aufgaben zeigt sich ein deutlicher Leistungssprung: GPT-5-Codex erzielt hier 51,3 % im Vergleich zu 33,9 % bei GPT-5. Diese Verbesserungen basieren auf Tests mit etablierten Open-Source-Projekten in Programmiersprachen wie Python, Go und OCaml.
Fokus auf Code-Reviews und Integration
Das Modell wurde zudem für Code-Reviews optimiert. Es analysiert Commits, prüft Abhängigkeiten, führt Tests aus und vergleicht Änderungen. Laut OpenAI liefert GPT-5-Codex präzisere und relevantere Kommentare als frühere Modelle, was die Effizienz von Code-Reviews steigern soll. Die Integration in Entwicklungsumgebungen erfolgt über eine Kommandozeilenschnittstelle (CLI), IDE-Erweiterungen (z.B. für VS Code) und eine Cloud-Umgebung. Die Cloud-Version kann automatisch Setups erkennen, Abhängigkeiten installieren und sogar einen Browser starten, um visuelle Ergebnisse zu überprüfen.
Verfügbarkeit und Tarife
GPT-5-Codex ist für Abonnenten von ChatGPT Plus, Pro, Business, Edu und Enterprise verfügbar. Höhere Tarife ermöglichen die Bearbeitung mehrerer Projekte pro Woche, und für Business- und Enterprise-Kunden gibt es die Möglichkeit, zusätzliche Nutzungskontingente zu erwerben. Eine API-Anbindung ist angekündigt, aber noch nicht veröffentlicht.