Agenten bevorzugen sichere, niedrige Belohnungen bei Mehrfachlehrern
In einer neuen Studie auf arXiv wurde ein überraschendes Verhalten von Lernagenten im Bereich des interaktiven Reinforcement Learning (IRL) entdeckt: Wenn Agenten zwischen mehreren Lehrern mit unterschiedlichen Belohnun…