RLFactory: Plug-and-Play-Framework stärkt Tool‑Nutzung von LLMs

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues Open‑Source-Framework namens RLFactory wurde auf arXiv vorgestellt und verspricht, die Interaktion von großen Sprachmodellen (LLMs) mit externen Tools zu revolutionieren. Durch einen Plug‑and‑Play-Ansatz kann RLFactory sofort in bestehende Systeme integriert werden, ohne dass umfangreiche Anpassungen nötig sind.

Die Kerninnovation liegt in einer asynchronen, asyncio‑basierten Aufruferarchitektur, die Tool‑Heterogenität und Schnittstellenprobleme überwindet. Gleichzeitig trennt das Framework die Tool‑ und Trainingskomponenten, sodass Entwickler flexibel neue Tools hinzufügen können. Ein vielseitiges Belohnungssystem unterstützt regelbasierte, modellgestützte und tool‑Verifikationssignale, wodurch die Lernumgebung robust und anpassungsfähig bleibt.

In praktischen Tests mit dem Qwen3‑4B-Modell auf dem Search‑R1‑Benchmark erzielte RLFactory einen Testwert von 0,486 auf dem Natural Questions‑Datensatz – ein klarer Vorsprung gegenüber größeren Modellen wie Qwen2.5‑7B‑Instruct‑GRPO (0,473). Zusätzlich steigert das Framework die Trainingsdurchsatzrate um 6,8‑fach, was die Effizienz deutlich erhöht.

RLFactory ist als leicht zugängliches, hochgradig anpassbares Tool für die Verbesserung der mehrrunden‑Tool‑Nutzung von LLMs in realen Anwendungen konzipiert. Der komplette Code steht unter GitHub zur Verfügung.

Ähnliche Artikel