Wie man Belohnungen manipuliert: Neue Grenzen für Reward‑Poisoning in linearen MDPs
In der neuesten Veröffentlichung auf arXiv wird ein umfassendes Bild von Reward‑Poisoning‑Angriffen im Bereich des Reinforcement Learning (RL) gezeichnet. Dabei manipuliert ein Angreifer gezielt die Belohnungen innerhal…