AgentXRay: Transparente Agentensysteme durch Workflow‑Rekonstruktion
Die neuesten Fortschritte bei großen Sprachmodellen zeigen, dass sie komplexe Aufgaben lösen können – doch viele agentische Systeme bleiben für Anwender und Entwickler unsichtbar, weil ihre internen Abläufe und Entscheidungswege verborgen bleiben. Dieses Problem erschwert die Kontrolle und das Vertrauen in automatisierte Agenten.
Um dem entgegenzuwirken, stellen die Autoren die Aufgabe „Agentic Workflow Reconstruction“ (AWR) vor: Ziel ist es, aus reinem Input–Output‑Verhalten ein explizites, nachvollziehbares Workflow‑Modell zu erzeugen, das das Verhalten eines Black‑Box‑Agents approximiert. AgentXRay ist ein darauf ausgelegtes Suchframework, das AWR als kombinatorisches Optimierungsproblem über diskrete Agentenrollen und Werkzeugaufrufe in einer Kettenstruktur formuliert.
Im Gegensatz zu herkömmlichen Distillationsmethoden liefert AgentXRay editierbare White‑Box‑Workflows, die die Zielausgaben unter einem beobachtbaren, outputbasierten Proxy‑Metrik exakt reproduzieren, ohne Zugriff auf die Modellparameter zu benötigen. Um die riesige Suchraumgröße zu bewältigen, kombiniert AgentXRay Monte‑Carlo‑Tree‑Search mit einem Red‑Black‑Pruning‑Mechanismus, der Proxy‑Qualität und Suchtiefe dynamisch integriert.
Experimentelle Ergebnisse in verschiedenen Domänen zeigen, dass AgentXRay eine höhere Proxy‑Ähnlichkeit erreicht und gleichzeitig den Token‑Verbrauch reduziert, verglichen mit ungefilterter Suche. Dadurch wird eine tiefere Exploration von Workflows bei festem Iterationsbudget ermöglicht, was AgentXRay zu einem vielversprechenden Werkzeug für die transparente Analyse und Steuerung agentischer Systeme macht.