Forschung
CUBE: Neuer Standard zur Vereinheitlichung von Agenten-Benchmarks
Die rasante Verbreitung von Agenten-Benchmarks hat ein starkes Fragmentierungsproblem geschaffen, das die Forschungseffizienz gefährdet. Fü…
arXiv – cs.AI