Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Begründungen”
Forschung

<h1>CoT-Distillation: Curriculum Learning mit strukturiertem Maskieren & GRPO</h1> <p>Die Übertragung von Chain‑of‑Thought‑(CoT)‑Logik aus großen Sprachmodellen in kompakte Nachschreibermodelle stellt ein zentrales Problem dar: die ausführlichen Begründungen der Lehrermodelle sind für kleinere Modelle oft zu umfangreich, um sie exakt zu replizieren. Traditionelle Ansätze reduzieren die Logik auf einen einzigen Schritt, wodurch die wertvolle Interpretierbarkeit verloren geht.</p> <p>In der neuen Studie wird

arXiv – cs.AI
Forschung

<p>Neues Paradigma für Moderation: Von sparsamen zu dichten Begründungen</p> <p>Die Sicherheit von Inhalten ist heute wichtiger denn je. Während textbasierte Moderationssysteme bereits hohe Erfolgsraten erzielen, bleiben multimodale Varianten – die Bild-, Video- und Audiodaten berücksichtigen – stark behindert durch Daten- und Supervisionssparsity. Klassische Ansätze, die ausschließlich auf binären Labels beruhen, führen häufig zu „Shortcut‑Learning“, bei dem Modelle oberflächliche Merkmale nutzen und die e

arXiv – cs.LG
Forschung

<h1>Ask WhAI: System zur Analyse von Glaubensbildung bei rollenbasierten LLM-Agenten</h1> <p>Mit Ask WhAI eröffnet ein neues Framework die Möglichkeit, die inneren Glaubensstrukturen von Sprachmodellen in komplexen Interaktionsszenarien zu untersuchen und gezielt zu verändern. Das System zeichnet sämtliche Agenteninteraktionen auf, ermöglicht deren Wiedergabe und erlaubt über den normalen Kommunikationskanal hinaus gezielte Abfragen zu den Überzeugungen und Begründungen jedes einzelnen Agenten.</p> <p>Ein b

arXiv – cs.AI