Forschung
Neue Messgrößen enthüllen Schwächen von KI-Agenten
KI-Agenten übernehmen zunehmend wichtige Aufgaben, doch trotz beeindruckender Genauigkeitswerte auf Standard-Benchmarks bleiben reale Fehle…
arXiv – cs.AI