Der tiefe Grund, warum KI immer noch "einfache Rätsel" nicht lösen kann - Die erstaunliche Kraft des menschlichen Gehirns erforschen: Menschen haben "Sekunden", KI hat "Labyrinthe"

Der tiefe Grund, warum KI immer noch "einfache Rätsel" nicht lösen kann - Die erstaunliche Kraft des menschlichen Gehirns erforschen: Menschen haben "Sekunden", KI hat "Labyrinthe"

ARC ist eine Aufgabe, bei der es darum geht, die "verborgenen Regeln" eines Farbgitters zu erkennen und anzuwenden, um die Generalisierungsfähigkeit aus wenigen Beispielen zu messen. In einem Interview mit Live Science erklärte Greg Kamrat vom ARC Prize, dass Menschen im Durchschnitt etwa 66 % bei ARC-AGI-2 erreichen, während KI immer noch Schwierigkeiten hat. "Solange es Probleme gibt, die Menschen lösen können, aber KI nicht, ist es kein AGI", erklärte er. OpenAIs o3 erzielte hohe Punktzahlen (75,7 % / 87,5 %) bei ARC-AGI-1 und löste einen "o3-Schock" aus, obwohl viele glauben, dass dies auf die durch hohe Rechenleistung unterstützte Spitzenleistung zurückzuführen ist. Der nächste Fokus liegt auf ARC-AGI-3. Anstatt Fragen einzeln zu beantworten, hat man zu einem "Agenten"-Test übergegangen, der die Erkundung, Planung und das Gedächtnis in 2D-Spielen im Umfang von 100 Spielen bewertet. Auf Reddit gibt es Diskussionen über die Terminologie, dass man es eher LLM als KI nennen sollte, sowie Unzufriedenheit von Nutzern, dass Hausarbeiten nicht erleichtert werden. Auf Hacker News wird lebhaft über den menschlichen Durchschnitt und die Interpretation der Punktzahlen diskutiert. Insgesamt nähert man sich AGI nicht durch die Verlängerung der Punktzahlen, sondern durch das Überdenken der Lerneffizienz und des Verhaltensdesigns.