Budgetgestützte Erreichbarkeit für sichere Offline RL
In der Welt der sequentiellen Entscheidungsfindung, die auf Markov Decision Processes basiert, haben sowohl modellbasierte als auch modellfreie Methoden beeindruckende Ergebnisse erzielt. Doch echte Anwendungen erforder…