MARS²: Mehrere Agenten verbessern Codegenerierung durch lernende Baumsuche
Reinforcement‑Learning‑Modelle haben bereits beeindruckende Ergebnisse bei komplexen Aufgaben wie der Codegenerierung erzielt. Ein häufiges Hindernis bleibt jedoch die begrenzte Vielfalt der Trajektorien, die zu abnehme…