ARC-AGI: Fortschritt bei KI-Intelligenz – Erste umfassende Analyse
Der neue Abstraction and Reasoning Corpus (ARC‑AGI) hat sich als entscheidendes Messinstrument für die Fluid Intelligence von KI-Systemen etabliert. In einer ersten, übergreifenden Analyse wurden 82 Ansätze aus drei Ben…
- Der neue Abstraction and Reasoning Corpus (ARC‑AGI) hat sich als entscheidendes Messinstrument für die Fluid Intelligence von KI-Systemen etabliert.
- In einer ersten, übergreifenden Analyse wurden 82 Ansätze aus drei Benchmark‑Versionen sowie die ARC‑Prize‑Wettbewerbe 2024‑2025 untersucht.
- Ein zentrales Ergebnis zeigt, dass die Leistung aller Paradigmen – von Programmsynthese über neuro‑symbolische Modelle bis hin zu neuronalen Netzwerken – zwischen ARC‑AG…
Der neue Abstraction and Reasoning Corpus (ARC‑AGI) hat sich als entscheidendes Messinstrument für die Fluid Intelligence von KI-Systemen etabliert. In einer ersten, übergreifenden Analyse wurden 82 Ansätze aus drei Benchmark‑Versionen sowie die ARC‑Prize‑Wettbewerbe 2024‑2025 untersucht.
Ein zentrales Ergebnis zeigt, dass die Leistung aller Paradigmen – von Programmsynthese über neuro‑symbolische Modelle bis hin zu neuronalen Netzwerken – zwischen ARC‑AGI‑1 und ARC‑AGI‑2 um das Zwei‑ bis Dreifache zurückgeht. Während Systeme aktuell 93 % auf ARC‑AGI‑1 erreichen (z. B. Opus 4.6), sinkt die Genauigkeit auf 68,8 % bei ARC‑AGI‑2 und nur noch 13 % bei ARC‑AGI‑3. Menschen bleiben dagegen nahezu fehlerfrei in allen Versionen.
Die Kosten pro Aufgabe sind in einem Jahr um 390‑fach gesunken – von 4 500 USD bei o3 auf 12 USD bei GPT‑5.2 – was vor allem auf eine geringere Parallelisierung im Testzeitraum zurückzuführen ist. Trillion‑Skalen‑Modelle zeigen große Schwankungen in Score und Kosten, während Kaggle‑beschränkte Einreichungen (660 M bis 8 B Parameter) konkurrenzfähige Ergebnisse liefern. Testzeit‑Anpassungen und Verfeinerungs‑Loops erweisen sich als entscheidende Erfolgsfaktoren, während kompositorisches Denken und interaktives Lernen noch ungelöst bleiben.
Die Gewinner des ARC‑Prize 2025 benötigten Hunderttausende synthetischer Beispiele, um 24 % auf ARC‑AGI‑2 zu erreichen, was die Wissensabhängigkeit des Reasonings unterstreicht. Diese erste Ausgabe der ARC‑AGI Living Survey dokumentiert den Stand der Forschung bis Februar 2026 und wird regelmäßig aktualisiert unter https://nimi-ai.com/arc-survey/.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Kontext ohne Glossar-Suche
Wenn du nach dieser Meldung weiterlernen willst
Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.