Der ARC-Benchmark, lange Zeit als nahezu unüberwindbares Hindernis für KI-Systeme angesehen, zeigt nun Anzeichen der Überwindung durch die fortschreitende Optimierung in KI-Labors. Der „Abstraction and Reasoning Corpus“ (ARC), auch bekannt als ARC-AGI, sollte ursprünglich die Fähigkeit von KI-Systemen testen, Neues zu lernen, anstatt lediglich statistische Muster zu reproduzieren. Aktuelle Ergebnisse deuten jedoch darauf hin, dass dieser Benchmark, wie viele seiner Vorgänger, von neueren Methoden übertroffen wird. Ein Beispiel hierfür sind die Resultate des KI-Unternehmens Poetiq, die darauf hinweisen, dass der ursprüngliche ARC-AGI-1-Benchmark weitgehend gelöst ist. Poetiq berichtet, dass ihre Systeme, die auf großen Modellen von Anbietern wie OpenAI oder Google basieren, die Leistung auf dem ersten Datensatz saturieren. Besonders bemerkenswert ist die Aussage, dass das System auf dem anspruchsvolleren ARC-AGI-2-Datensatz Ergebnisse erzielt hat, die die durchschnittliche menschliche Leistung von 60 Prozent übertreffen.
You May Also Like
ChatGPT wird zum Online-Shop: OpenAI integriert direkte Bezahlfunktion
KI Snack
- 29. September 2025
OpenAI hat eine neue Funktion für ChatGPT eingeführt, die es Nutzern ermöglicht, Produkte direkt über die Chat-Oberfläche zu kaufen. Diese "Instant Checkout"-Funktion startet zunächst für US-Nutzer und soll bald auf…
Apple im Visier: Autoren verklagen Tech-Giganten wegen KI-Training mit illegalen Buchkopien
KI Snack
- 7. September 2025
US-Autoren haben in Kalifornien Klage gegen Apple eingereicht und werfen dem Unternehmen vor, urheberrechtlich geschützte Werke ohne Zustimmung für das Training seiner KI-Modelle genutzt zu haben. Im Zentrum der Anschuldigungen…
Googles TPUv7-Chips: Neue Konkurrenz für Nvidia im KI-Markt
KI Snack
- 30. November 2025
Googles TPUv7-Chips: Neue Konkurrenz für Nvidia im KI-Markt Matthias Bastian View the LinkedIn Profile of Matthias Bastian 29. November 2025 Nano Bana Pro prompted by THE DECODER Kurz & Knapp…
OpenAI revolutioniert KI-Sicherheit mit neuen Open-Source-Modellen
KI Snack
- 31. Oktober 2025
OpenAI hat mit gpt-oss-safeguard eine innovative Modellreihe für die Sicherheitsklassifizierung von KI-Anwendungen veröffentlicht. Diese Open-Source-Modelle, verfügbar in zwei Größen (120b und 20b), bieten Entwicklern eine flexible und transparente Möglichkeit, Sicherheitsrichtlinien…
Microsoft Copilot revolutioniert Zusammenarbeit: KI-Gruppenchats für bis zu 32 Personen
KI Snack
- 23. Oktober 2025
Microsoft hat mit seinem Herbst-Update für Copilot eine neue Ära der KI-gestützten Zusammenarbeit eingeläutet. Die wichtigste Neuerung ist die Einführung von „Groups“, einer Gruppenchat-Funktion, die es bis zu 32 Teilnehmern…
Forschungsteam präsentiert neues KI-Gedächtnis zur Minimierung von Informationsverlust
KI Snack
- 2. Dezember 2025
Ein chinesisches Forschungsteam hat eine innovative Speicherarchitektur für KI-Agenten entwickelt. Das System mit dem Namen GAM zielt darauf ab, den Informationsverlust bei langen Interaktionen zu reduzieren, indem es Kompression mit…