Forschung
Soft MPCritic: Amortisierte Modellprädiktive Wertiteration
Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz kombiniert die Stärken von Reinforcement Learning (RL) und Model Pr…
arXiv – cs.LG