EAGLET verbessert KI-Agenten bei langwierigen Aufgaben durch maßgeschneiderte Pläne
Im Jahr 2025 versprach Nvidia-Chef Jensen Huang, dass KI-Agenten die Zukunft bestimmen würden. Tatsächlich haben führende Anbieter wie OpenAI, Google und chinesische Konkurrenten wie Alibaba zahlreiche feinabgestimmte Modelle und Anwendungen für spezialisierte Aufgaben wie Websuche und Berichtserstellung veröffentlicht. Doch ein entscheidendes Hindernis bleibt: KI-Agenten, die über viele Schritte hinweg an einer Aufgabe arbeiten, neigen dazu, den Fokus zu verlieren.
Unabhängige Benchmark-Tests zeigen, dass selbst die leistungsstärksten Modelle bei längeren Aufgaben höhere Fehlerquoten aufweisen. Je mehr Schritte ein Agent ausführen muss und je länger die Aufgabe dauert, desto größer steigt die Wahrscheinlichkeit von Fehlentscheidungen und Halluzinationen.
Um dieses Problem zu lösen, hat ein interdisziplinäres Forschungsteam aus der Tsinghua-Universität, der Peking-Universität, DeepLang AI und der University of Illinois Urbana-Champaign das akademische Framework EAGLET entwickelt. EAGLET bietet einen „globalen Planer“, der in bestehende Agenten-Workflows integriert werden kann, um die Planung zu optimieren und die Effizienz zu steigern.
Der feinabgestimmte Sprachmodell-Planer interpretiert die Aufgabenanweisungen – typischerweise als Prompt vom Nutzer oder der Umgebung – und erstellt einen hochrangigen Plan, der von einem eigenen LLM unterstützt wird. Während der Ausführung greift EAGLET nicht ein, liefert aber vorab klare Leitlinien, die Planungsfehler reduzieren und die Erfolgsrate bei langwierigen Aufgaben erhöhen.