Neue Einsichten in die Cramér-Metrik des Bellman-Operators
In der distributionalen Verstärkungslern‑Forschung (DRL) wird die Entwicklung ganzer Rückkehrverteilungen durch Bellman‑Updates untersucht, statt nur Erwartungswerte zu betrachten. Ein klassisches Resultat besagt, dass…