Analyse zeigt systematische Denkfehler in aktuellen KI-Modellen von OpenAI und Anthropic
Eine aktuelle Analyse der ARC Prize Foundation zeigt, dass die neuesten KI-Modelle GPT-5.5 und Opus 4.7 in systematischen...
Eine aktuelle Analyse der ARC Prize Foundation zeigt, dass die neuesten KI-Modelle GPT-5.5 und Opus 4.7 in systematischen...
Die Ergebnisse des MLPerf Inference v6.0 zeigen Rekorde von Nvidia, AMD und Intel, doch die Vergleichbarkeit bleibt schwierig....
Der neue Benchmark ARC-AGI-3 stellt KI-Modelle in interaktiven Spielumgebungen vor eine große Herausforderung. Trotz ihrer hohen Rechenleistung erreichen...
Das KI-Modell Claude Opus 4.6 von Anthropic hat in einem Benchmark beeindruckende Fähigkeiten gezeigt, indem es eigenständig den...
OpenAI präsentiert mit FrontierScience einen neuen Benchmark, der KI-Modelle auf Olympiade- und Forschungsniveau evaluiert. Das firmeneigene Modell GPT-5.2...
Runway hat sein neuestes Videomodell, Gen-4.5, vorgestellt. Laut Herstellerangaben und ausgewählten Benchmarks übertrifft es die Konkurrenz, hat jedoch...