Sprachmodelle revolutionieren PDDL-Planung: KI erstellt beweisbare Strategien
Forscher haben gezeigt, dass moderne Sprachmodelle (LMs) in der Lage sind, komplexe Planungsaufgaben in der Planning Domain Definition Language (PDDL) zu lösen, indem sie Python‑Programme generieren, die als allgemeine Richtlinien für ganze Domänen dienen. Diese Programme sind nachweislich korrekt, ohne dass externe Prüfer benötigt werden.
In umfangreichen Tests auf Wettbewerbsbenchmarks konnte das neue System, das als LMPlan bezeichnet wird, mehr PDDL‑Probleme lösen als herkömmliche Planer und aktuelle KI‑Ansätze – und das unter streng festgelegten Zeit- und Speichergrenzen. LMPlan bewältigt dabei Aufgaben mit mehreren hundert relevanten Objekten.
Ein überraschendes Ergebnis ist, dass die Modelle manchmal sogar besser planen, wenn die PDDL‑Aufgaben mit sinnlosen Symbolen statt natürlicher Sprache formuliert sind, z. B. (at dog kitchen) als (p2 o1 o3). Diese Beobachtung stellt die Annahme in Frage, dass LMs ausschließlich auf Wortsemantik und Trainingsdaten zurückgreifen, und eröffnet neue Forschungsfelder.