Neue Methode SLEA‑RL verbessert LLM‑Agenten bei mehrstufigen Aufgaben
In der Forschung zu großen Sprachmodellen (LLM) haben Agenten bereits beeindruckende Ergebnisse bei mehrstufigen Tool‑Use‑Aufgaben erzielt. Dabei werden sie jedoch bislang isoliert trainiert, sodass sie keine Erfahrunge…