Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “World State”
Forschung

<h1>LLMs zeigen Schwächen beim Schach: neues Bewertungsmodell enthüllt</h1> <p>Neues Forschungspapier aus dem arXiv‑Repository präsentiert ein innovatives, modellunabhängiges Verfahren, mit dem die Fähigkeit großer Sprachmodelle (LLMs) bewertet wird, strukturierte Welten zu verfolgen. Anstatt sich auf interne Aktivierungen zu stützen, nutzt die Methode den Schachspielstand als Prüfstand und untersucht die Verteilung zulässiger Züge, um die semantische Genauigkeit der vom Modell vorhergesagten Spielzustände

arXiv – cs.AI