ARC-AGI: wie man Intelligenz durch die Lernfähigkeit misst, anstatt durch angesammelte Fähigkeiten
Die meisten KI-Benchmarks bewerten das Ergebnis. ARC-AGI verlagert den Fokus auf den Prozess – wie effektiv das System Neues lernt. Das Problem zeigt sich auf der Ebene der Metriken. Moderne Systeme zeigen ein hohes Maß an Automatisierung, aber dies ist oft eine Folge der Skalierung von Daten und Berechnungen und nicht des Wachstums der Generalisierungsfähigkeit. … Weiterlesen