Learning When to Plan: Efficiently Allocating Test-Time Compute for LLM Agents
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
AutoTraj: Automatisches Lernen von Tool‑Use‑Pfaden für KI‑Reasoning
arXiv – cs.AI
•
UniMo: KI-gestützte Bewegungsgenerierung und -verständnis revolutioniert
arXiv – cs.LG
•
LLM-Training neu: Selbstkorrigierende, lange Denkketten steigern Matheleistung
arXiv – cs.AI
•
JT-DA-8B: KI-Modell revolutioniert Tabellenanalyse mit Tool-gestütztem Denken
arXiv – cs.AI
•
Meta-Policy Reflexion: Reusable Reflective Memory and Rule Admissibility for Resource-Efficient LLM Agent
arXiv – cs.AI
•
LLMs im Pokerspiel: Noch weit von Profis entfernt – ToolPoker setzt neue Maßstäbe