Neues Benchmark GUIDE bewertet KI-Assistenz bei GUI-Aufgaben
Ein neues Benchmark namens GUIDE (GUI User Intent Detection Evaluation) wurde veröffentlicht, um die Fähigkeit von KI-Modellen zu prüfen, Nutzerverhalten in grafischen Benutzeroberflächen zu verstehen und gezielt zu unt…