<strong>LLMs können UNO spielen – aber nur wenige helfen aktiv anderen zu gewinnen</strong>
In einer neuen Studie von arXiv (2509.09867v1) wird untersucht, ob große Sprachmodelle (LLMs) nicht nur Fragen beantworten, sondern aktiv als Mitspieler in einem Mehrspieler‑Kartenspiel agieren können. Dabei geht es darum, ob ein LLM einem menschlichen Gegner dabei hilft, das Spiel zu gewinnen, anstatt selbst zu gewinnen.
Die Forscher entwickelten ein Tool, das decoder‑only LLMs in die RLCard‑Umgebung einbindet. Die Modelle erhalten die komplette Spiel‑State‑Information und antworten über einfache Text‑Prompts. Zwei unterschiedliche Prompting‑Strategien wurden getestet, während Modelle von 1 B bis 70 B Parametern evaluiert wurden.
Alle getesteten Modelle übertrafen einen zufälligen Baseline, konnten jedoch nur wenige signifikant einem anderen Spieler zum Sieg verhelfen. Die Ergebnisse zeigen, dass die Modellgröße einen Einfluss hat, aber die Fähigkeit, aktiv zu unterstützen, noch begrenzt ist.