Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Demonstrationen”
Forschung

<h1>Neues Verfahren: Präferenzbasiertes Lernen sicherer RL-Modelle</h1> <p>In der sicheren Verstärkungslern‑Forschung (Safe RL) gilt die Einhaltung von Sicherheits­bedingungen als entscheidend. In der Praxis sind diese Bedingungen jedoch oft komplex, subjektiv und schwer exakt zu formulieren. Traditionelle Methoden zur Ableitung von Constraints setzen auf starke Annahmen oder benötigen umfangreiche Experten­demonstrationen – beides ist in vielen Anwendungen unrealistisch.</p> <p>Eine vielversprechende Alter

arXiv – cs.LG
Forschung

Sicherheitsorientiertes Q‑Learning: Expertenbeispiele bei unbekannten Beschränkungen In einer neuen Studie aus dem Bereich der künstlichen Intelligenz wird gezeigt, wie Agenten aus sicheren Demonstrationen lernen können, selbst in Umgebungen mit unbekannten Beschränkungen zu agieren. Das Ziel ist es, eine Politik zu entwickeln, die die Wahrscheinlichkeit von sicheren, aber gleichzeitig lohnenden Handlungen maximiert. Der Ansatz, der als SafeQIL (Sicheres Q‑Inverse Konstrahiertes Verstärkungslernen) bezeic

arXiv – cs.LG