KI News: Kurz und klar.

Anmelden

Learning When to Plan: Efficiently Allocating Test-Time Compute for LLM Agents

arXiv – cs.AI • 05.09.2025 05:00 • Original

#LLM #Reinforcement Learning #Dynamische Planung #React #Crafter #Supervised Fine-Tuning #Menschengeschriebene Pläne #Langzeitaufgaben

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 02.02.2026 05:00

AutoTraj: Automatisches Lernen von Tool‑Use‑Pfaden für KI‑Reasoning

arXiv – cs.AI • 21.01.2026 05:00

UniMo: KI-gestützte Bewegungsgenerierung und -verständnis revolutioniert

arXiv – cs.LG • 12.01.2026 05:00

LLM-Training neu: Selbstkorrigierende, lange Denkketten steigern Matheleistung

arXiv – cs.AI • 09.12.2025 05:00

JT-DA-8B: KI-Modell revolutioniert Tabellenanalyse mit Tool-gestütztem Denken

arXiv – cs.AI • 05.09.2025 05:00

Meta-Policy Reflexion: Reusable Reflective Memory and Rule Admissibility for Resource-Efficient LLM Agent

arXiv – cs.AI • 03.02.2026 05:00

LLMs im Pokerspiel: Noch weit von Profis entfernt – ToolPoker setzt neue Maßstäbe