Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Entropy”
Forschung

<p>Neues Framework IE-CL steigert Contrastive Learning durch Entropieoptimierung</p> <p>Contrastive Learning hat sich als äußerst wirkungsvolle Methode für selbstüberwachtes Lernen etabliert, wobei häufig informationstheoretische Ziele wie die Maximierung der gegenseitigen Information zum Einsatz kommen. Die Autoren des neuen Papers erkennen jedoch die Schwächen starrer Datenaugmentierungen und starre Invarianz-Beschränkungen und stellen ein innovatives Konzept vor: IE-CL (Incremental-Entropy Contrastive Le

arXiv – cs.LG
Forschung

<p>Metakognitive Entropie-Kalibrierung verbessert verifizierbares RL-Reasoning</p> <p>In den letzten Jahren haben große Rechenmodelle für komplexe Aufgaben, wie Mathematik und Frage‑Antwort‑Systeme, enorme Fortschritte erzielt. Diese Modelle werden meist mit Reinforcement Learning und verifizierbaren Belohnungen (RLVR) trainiert. Dabei wird jedoch fast ausschließlich ein binäres Korrektheitssignal verwendet, während die inhärente Unsicherheit des Modells weitgehend ignoriert wird. Dieses „Uncertainty‑Reward

arXiv – cs.AI