Revolutioniert OpenAI den Wissenschaftstest: GPT-5.2 glänzt, scheitert jedoch an komplexen Aufgaben
OpenAI präsentiert mit FrontierScience einen neuen Benchmark, der KI-Modelle auf Olympiade- und Forschungsniveau evaluiert. Das firmeneigene Modell GPT-5.2 erzielt hierbei die besten Ergebnisse, dennoch offenbaren die Aufgaben auch die Limitationen…