Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Beweis”
Forschung

<p>LLMs meistern Mehrstufige Theoremvorhersage dank struktureller Priors</p> <p>In der automatisierten Beweistechnik stellt die Vorhersage von mehrstufigen Theoremen eine zentrale Herausforderung dar. Traditionelle neuronale‑symbolische Ansätze setzen stark auf überwachungsbasierte, parametrisierte Modelle, die jedoch bei sich wandelnden Theorem-Bibliotheken nur begrenzte Generalisierung zeigen. In einer neuen Studie wird ein komplett trainingsfreier Ansatz vorgestellt, der auf In‑Context‑Learning (ICL) bas

arXiv – cs.AI
Forschung

<h1>MC-Search: Benchmark für multimodale Agenten mit langen Beweisketten</h1> <p>Die neueste Veröffentlichung auf arXiv (2603.00873v1) stellt MC‑Search vor – ein wegweisendes Benchmark‑Set, das multimodale Agenten in ihrer Fähigkeit testet, komplexe, mehrstufige und wissensbasierte Aufgaben zu lösen. Im Gegensatz zu bisherigen Tests, die meist kurze Frage‑Antwort‑Ketten abbilden, umfasst MC‑Search 3 333 hochwertige Beispiele, die durchschnittlich 3,7 Schritte (Hops) enthalten und fünf typische Denkstrukture

arXiv – cs.AI