Forschung
VenusBench-Mobile: Neuer, realitätsnaher Benchmark für mobile GUI-Agenten
Die meisten Online-Benchmarks für mobile GUI-Agenten konzentrieren sich noch immer stark auf einzelne Apps und standardisierte Aufgaben. Da…
arXiv – cs.AI