A black and white photo of a person on a skateboard

OpenAI veröffentlicht GPT-5.1: Verbesserte Code-Performance und neuer „No Reasoning“-Modus

OpenAI hat die neueste Version seines Sprachmodells, GPT-5.1, über seine API zugänglich gemacht. Das Update bringt moderate Leistungssteigerungen, insbesondere im Bereich der Code-Generierung, sowie einen neuen "No Reasoning"-Modus für schnellere Antworten. Spezielle Codex-Varianten für langlebige Programmieraufgaben und ein erweitertes Prompt-Caching sind ebenfalls neu.

Key Takeaways

  • GPT-5.1 ist jetzt über die API verfügbar und bietet verbesserte Code-Performance.
  • Zwei neue Modelle, gpt-5.1-codex und gpt-5.1-codex-mini, sind für Programmieraufgaben optimiert.
  • Ein "No Reasoning"-Modus ermöglicht deutlich schnellere Antworten.
  • Das Prompt-Caching wurde auf bis zu 24 Stunden erweitert.
  • Sicherheitsbewertungen zeigen gemischte Ergebnisse, mit Fortschritten beim Jailbreak-Schutz, aber Rückschritten bei sensiblen Themen.

Verbesserte Code-Performance und neue Tools

GPT-5.1 zeigt in Benchmarks, die sich auf das Programmieren konzentrieren, deutliche Verbesserungen. Im SWE-bench-Test erreicht das Modell eine Erfolgsquote von 76,3 %, verglichen mit 72,8 % bei GPT-5. Auch in anderen Bereichen wie GPQA Diamond und MMMU gibt es leichte Zuwächse. Neu ist das Tool apply_patch, das es GPT-5.1 ermöglicht, Code gezielt zu modifizieren und Dateien zu erstellen oder zu bearbeiten. Das Shell-Tool unterstützt die Ausführung und Bewertung von Kommandozeilenbefehlen, was die Automatisierungsfähigkeiten für Entwickler weiter stärkt.

Der "No Reasoning"-Modus

Eine wesentliche Neuerung ist der "No Reasoning"-Modus. In diesem Modus arbeitet GPT-5.1 bewusst ohne tiefgehende Denkprozesse, was zu erheblich schnelleren Antwortzeiten führt. OpenAI gibt an, dass das Modell in diesem Modus GPT-5 mit minimalem Reasoning übertrifft, insbesondere bei Aufgaben, die Tool-Nutzung, Codeausführung oder Websuche beinhalten.

Längeres Prompt-Caching und allgemeine Verfügbarkeit

Das erweiterte Prompt-Caching ist eine weitere wichtige Verbesserung. Es ermöglicht die Speicherung von Prompts für bis zu 24 Stunden. Dies kann bei wiederholten Abfragen zu spürbaren Geschwindigkeits- und Kosteneinsparungen führen. GPT-5.1 ist seit gestern auch allgemein in ChatGPT verfügbar. OpenAI betont, dass bei der Entwicklung besonderer Wert auf die Prompt-Befolgung und eine wärmere, menschlichere Tonalität gelegt wurde.

Sicherheitsbewertung: Ein gemischtes Bild

Die begleitende Sicherheitsbewertung von OpenAI zeigt ein uneinheitliches Bild. Das gpt-5.1-instant-Modell weist eine deutlich verbesserte Resistenz gegen Jailbreaks auf, mit einem Anstieg des StrongReject-Werts von 0,850 auf 0,976. Allerdings gibt es Rückschritte bei der Handhabung sensibler Themen wie Belästigung, Hassrede oder Gewalt, wo die Leistung teilweise um fünf bis acht Prozentpunkte sinkt. Auch bei der emotionalen Abhängigkeit sind leichte Einbußen zu verzeichnen. Die Bewertung der mentalen Gesundheit zeigt Verbesserungen beim gpt-5.1-thinking-Modell, während das gpt-5.1-instant-Modell hier leicht zurückfällt. OpenAI selbst weist auf die geringe statistische Verlässlichkeit einiger Ergebnisse hin, sodass die tatsächlichen Auswirkungen im Alltag abzuwarten bleiben.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

You May Also Like