DALI: Dynamikabgestimmt latente Vorstellung verbessert ZeroShot-Generalisierung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der realen Welt muss ein Lernagent neue Umgebungen ohne aufwendiges Retraining meistern. Das neue Konzept DALI (Dynamics‑Aligned Latent Imagination) löst dieses Problem, indem es latente Kontextvariablen aus den Interaktionen des Agenten mit seiner Umgebung extrahiert. Dadurch wird die Notwendigkeit expliziter Kontextparameter wie Reibung oder Gravitation überflüssig.

DALI integriert einen selbstüberwachten Encoder in die Dreamer‑Architektur. Der Encoder lernt, die zukünftige Dynamik vorherzusagen, und liefert daraus latente Repräsentationen, die sowohl das Weltmodell als auch die Policy konditionieren. Diese latenten Zustände verbinden Wahrnehmung und Steuerung und ermöglichen es dem Agenten, die Wirkung von Kontextänderungen zu verstehen, ohne dass diese explizit gemessen werden.

Die Autoren zeigen theoretisch, dass der Encoder ein entscheidender Baustein für effiziente Kontextinferenz und robuste Generalisierung ist. Durch gezielte Störungen einer Dimension, die die Gravitation kodiert, entstehen in den imaginären Rollouts physikalisch plausibel veränderte Szenarien – ein Beweis für die Konsistenz der latenten Raumdarstellung.

Auf anspruchsvollen cMDP‑Benchmarks übertrifft DALI kontextunabhängige Baselines deutlich und schlägt sogar kontextbewusste Modelle bei Extrapolationstests. Das Ergebnis ist eine echte Zero‑Shot‑Generalisation: Der Agent kann neue, zuvor nicht gesehene Kontextvariationen sofort handhaben, ohne zusätzliche Trainingsschritte.

Ähnliche Artikel