SEA‑Eval: Benchmark für selbstentwickelnde Agenten über Episoden hinaus
Die neuesten LLM‑basierten Agenten glänzen bei einzelnen Aufgaben, bleiben jedoch durch starre Werkzeugsets und episodisches Vergessen in ihrer Weiterentwicklung eingeschränkt. Das neue SEA‑Paradigma – Self‑Evolving Age…