Forschung
Wie man Belohnungen manipuliert: Neue Grenzen für Reward‑Poisoning in linearen MDPs
In der neuesten Veröffentlichung auf arXiv wird ein umfassendes Bild von Reward‑Poisoning‑Angriffen im Bereich des Reinforcement Learning (…
arXiv – cs.LG