Forschung
Neuer Benchmark Frontier-Eng misst KI-Agenten bei realen Ingenieuraufgaben
Die Wissenschaft der künstlichen Intelligenz erhält mit Frontier-Eng einen neuen Maßstab: Ein von Menschen verifizierter Benchmark, der KI-…
arXiv – cs.AI