Leading the Follower: LLM-Agenten meistern soziale Deduktion durch überzeugende Kommunikation
In den letzten Jahren haben große Sprachmodelle (LLMs) bemerkenswerte Fortschritte in sozialen Deduktionsspielen (SDGs) erzielt. Bisher lag der Fokus der Forschung jedoch vorwiegend auf der Verarbeitung von Informationen und der Auswahl von Strategien, während die Rolle der Überzeugungskommunikation kaum berücksichtigt wurde. In SDGs ist der Erfolg nicht nur von korrekten Schlussfolgerungen abhängig, sondern auch davon, andere Spieler dazu zu bringen, im Einklang mit den eigenen Absichten zu handeln.
Um diese Lücke zu schließen, wird die Interaktion in SDGs als Stackelberg-Wettbewerb modelliert: Der aktuelle Spieler agiert als Leader, der gezielt die Reaktion des Followers beeinflusst. Aufbauend auf dieser theoretischen Basis wurde ein Reinforcement-Learning-Framework entwickelt, das Agenten trainiert, ihre Äußerungen so zu gestalten, dass sie möglichst überzeugend wirken.
Durch umfangreiche Experimente in drei unterschiedlichen SDGs konnten die neu entwickelten Agenten die Leistung der bisherigen Baselines deutlich übertreffen. Diese Ergebnisse markieren einen wichtigen Schritt in Richtung KI-Agenten, die strategisch soziale Einflüsse ausüben können – ein Potenzial, das weit über Spiele hinaus in Szenarien mit überzeugender Kommunikation Anwendung finden kann.