KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “SEA-Eval”

SEA‑Eval: Benchmark für selbstentwickelnde Agenten über Episoden hinaus

Die neuesten LLM‑basierten Agenten glänzen bei einzelnen Aufgaben, bleiben jedoch durch starre Werkzeugsets und episodisches Vergessen in i…

arXiv – cs.AI 13.04.2026 04:00