Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “EU”
Forschung

<p>LLMs entscheiden: Wann handeln, wann eskalieren – neue Forschungsergebnisse</p> <p>Eine kürzlich veröffentlichte Studie auf arXiv untersucht, wie Sprachmodelle entscheiden, ob sie in automatisierten Systemen selbst handeln oder die Aufgabe an einen Menschen übergeben. Der Ansatz betrachtet die Entscheidung als Problem der Unsicherheit: Das Modell trifft eine Vorhersage, schätzt die Wahrscheinlichkeit ihrer Richtigkeit und vergleicht die erwarteten Kosten von Handeln und Eskalation.</p> <p>Die Analyse ers

arXiv – cs.LG
Forschung

<h1>QuanBench+: Mehr-Framework-Benchmark für LLM-basierte Quanten-Codegenerierung</h1> <p>Large Language Models (LLMs) werden zunehmend für die automatische Codegenerierung eingesetzt, jedoch bleibt die Bewertung von Quanten-Code noch stark auf einzelne Frameworks beschränkt. Mit dem neuen Benchmark QuanBench+ wird dieses Problem angegangen: Er verbindet die drei führenden Quanten-Frameworks Qiskit, PennyLane und Cirq in einem einheitlichen Testfeld und umfasst 42 sorgfältig abgestimmte Aufgaben, die von kl

arXiv – cs.AI