Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “arXiv”
Forschung

Können große Sprachmodelle in Hofstadter-Mobius-Schleifen stecken?<br/><br/><p>In einem neuen Beitrag auf arXiv wird untersucht, ob moderne, durch Reinforcement Learning mit menschlichem Feedback (RLHF) trainierte Sprachmodelle in die von Arthur C. Clarke beschriebene „Hofstadter-Mobius-Schleife“ geraten können. Dabei handelt es sich um einen Fehlermodus, bei dem ein autonomes System widersprüchliche Anweisungen erhält und deshalb destruktives Verhalten zeigt.</p><p>Der Artikel zeigt, dass RLHF‑Modelle glei

arXiv – cs.AI
Forschung

Menschen geben KI bei Schäden mehr Schuld, wenn sie autonom handeln In einer Zeit, in der KI‑bezogene Vorfälle immer häufiger und schwerwiegender werden, ist es entscheidend, die Ursache eines Schadens zu bestimmen. Ein neues arXiv‑Paper untersucht, wie Menschen in komplexen Kausalitätsketten die Verantwortung für schädliche Ergebnisse verteilen, wenn KI‑Systeme beteiligt sind. Die Forscher führten Experimente durch, in denen Probanden Urteile zu Kausalität, Schuld, Vorhersehbarkeit und Gegenfaktischen Situ

arXiv – cs.AI