MARS: Neuer Agent für automatisierte KI‑Forschung mit reflektiver Suche

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die Automatisierung von KI‑Forschung unterscheidet sich grundlegend von herkömmlicher Softwareentwicklung, weil die Bewertung von Modellen extrem rechenintensiv ist und die Ursachen für Leistungsunterschiede schwer nachzuvollziehen sind. Der neue Agent MARS (Modular Agent with Reflective Search) wurde speziell für diese Herausforderungen entwickelt und setzt dabei auf drei zentrale Prinzipien.

Erstens nutzt MARS ein budget‑bewusstes Planen: Durch einen kostenbeschränkten Monte‑Carlo‑Tree‑Search (MCTS) wird die Balance zwischen erwarteter Leistung und tatsächlichen Ausführungskosten explizit berücksichtigt. Zweitens folgt das System einer modularen Bauweise, die einen „Design‑Decompose‑Implement“-Pipeline‑Ansatz verwendet, um komplexe Forschungs­repositorien übersichtlich zu strukturieren. Drittens adressiert MARS die Problemstellung der Kreditzuweisung mit einer vergleichenden reflektiven Speicher‑Komponente, die Unterschiede zwischen Lösungen analysiert und daraus hochsignifikante Erkenntnisse extrahiert.

In Tests auf dem MLE‑Bench‑Benchmark erzielt MARS die bestmögliche Leistung unter vergleichbaren Bedingungen und bleibt dabei mit den Top‑Methoden der globalen Leaderboard‑Liste konkurrenzfähig. Besonders bemerkenswert ist, dass 63 % aller genutzten Lektionen aus dem Transfer zwischen verschiedenen Suchzweigen stammen – ein klarer Hinweis darauf, dass der Agent Erkenntnisse effektiv über unterschiedliche Suchpfade hinweg generalisiert.

Ähnliche Artikel