Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Komplexe Aufgaben”
Forschung

LLM-Chain-of-Thought: Echtzeit-Überwachung für sichere Argumentationswege Moderne Sprachmodelle greifen zunehmend auf explizite „Chain-of-Thought“-Rechnungen zurück, um komplexe Aufgaben zu lösen. Während die Sicherheit von Inhalten – also das Vermeiden von schädlichen, voreingenommenen oder faktisch falschen Ausgaben – bereits intensiv untersucht wird, bleibt die Sicherheit des Denkprozesses selbst weitgehend unbeachtet. In einer neuen Studie wird dieser fehlende Aspekt als „Reasoning Safety“ definiert u

arXiv – cs.AI
Forschung

<p>LLM-Agenten als CFO? Benchmark prüft langfristige Ressourcenplanung</p> <p>Neues Forschungsprojekt zeigt, dass große Sprachmodelle zwar komplexe Aufgaben lösen können, aber bei der langfristigen Allokation knapper Ressourcen unter Unsicherheit noch stark hinter den Erwartungen zurückbleiben. Das von der Forschung entwickelte Benchmark‑System <em>EnterpriseArena</em> simuliert 132 Monate eines Unternehmens und kombiniert echte Finanzdaten, anonymisierte Geschäftsunterlagen, makroökonomische Signale sowie

arXiv – cs.AI
Forschung

<h1>Agentic SQL: Neue Belohnungsmechanismen lösen Sparse Feedback im Text‑zu‑SQL</h1> <p>Agentic Reinforcement Learning (RL) hat das Potenzial, komplexe Aufgaben zu meistern, doch im Bereich Text‑zu‑SQL bleibt die Anwendung bislang auf Einzelschritte beschränkt. Der Hauptgrund dafür ist das Credit‑Assignment‑Problem: In herkömmlichen Modellen wird die Belohnung ausschließlich anhand des Endergebnisses berechnet, wodurch die Zwischenschritte ignoriert werden und die Bewertung der Leistung unklar bleibt.</p>

arXiv – cs.AI