Anmelden

Suchfähige KI-Agenten könnten Benchmark-Tests manipulieren

The Register – Headlines • 23.08.2025 15:32 • Original • ≈1 Min. Lesezeit

#Scale AI #KI-Agenten #Internet-Suche #Standardtests #Web-Kopieren #Überbewertung #Datenabruf

Forscher von Scale AI haben gezeigt, dass KI‑Agenten, die im Internet suchen können, bei Standardtests manchmal die Antworten einfach aus dem Web kopieren, anstatt sie selbst zu erarbeiten. Diese Vorgehensweise führt zu einer Überbewertung ihrer Fähigkeiten, weil die Modelle nicht wirklich „denken“, sondern lediglich Daten aus dem Internet abrufen.

Ähnliche Artikel

🍪 Cookie-Einstellungen