RAG-Systeme: Mit Bandit-Lernen 35 % mehr Präzision bei Dokumenten
Ein neues arXiv‑Veröffentlichung (2510.18633v1) beleuchtet, wie Retrieval‑Augmented Generation (RAG) Systeme komplexe Nutzeranfragen in Teilanfragen zerlegen, relevante Dokumente abrufen und anschließend zu einer Antwort zusammenführen. Dabei steht die effiziente Auswahl der Dokumente im Fokus: Man muss breit genug suchen, um alle relevanten Informationen zu erfassen, aber gleichzeitig den Abruf begrenzen, um Rauschen und Rechenaufwand zu minimieren.
Die Autoren stellen das Problem als ein Ausbalancieren von Exploration und Exploitation dar. Beim Abruf eines Dokuments entsteht ein „Glauben“ über die Nützlichkeit einer Teilanfrage, der entscheidet, ob man weiter in die gleiche Richtung sucht oder neue Alternativen ausprobiert. Für diese Entscheidungsfindung werden verschiedene Bandit‑Lernmethoden eingesetzt.
Die Experimente zeigen eindrucksvoll, dass die Kombination aus Ranginformationen und menschlichen Bewertungen die Dokumentenrelevanz signifikant verbessert: Die Präzision auf Dokumentebene steigt um 35 %, die α‑nDCG um 15 % und die Qualität der generierten Langformtexte verbessert sich deutlich. Diese Ergebnisse unterstreichen, wie wichtig ein dynamisches, lernbasiertes Auswahlverfahren für die Leistungsfähigkeit moderner RAG‑Systeme ist.