KI News: Kurz und klar.

Anmelden

Boosting Accuracy and Efficiency of Budget Forcing in LLMs via Reinforcement Learning for Mathematical Reasoning

arXiv – cs.AI • 27.10.2025 04:00 • Original

#Testzeit-Skalierung #Budgetforcing #Reinforcement Learning #Token-Effizienz #Mathematisches Reasoning #GSM8K #große Sprachmodelle

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 03.02.2026 05:00

Ressourcenschonende Verstärkung für LLMs: One-Shot-Policy-Optimierung

arXiv – cs.LG • 22.01.2026 05:00

NSF-Workshop: KI revolutioniert die elektronische Designautomatisierung

arXiv – cs.LG • 21.01.2026 05:00

R$^2$PO trennt Trainingspfade von Inferenzantworten und steigert LLM-Logik

arXiv – cs.LG • 16.01.2026 05:00

Sparse‑RL: Speicherprobleme bei LLM‑Reinforcement Learning überwinden

arXiv – cs.AI • 16.01.2026 05:00

DecisionLLM: LLMs revolutionieren langfristige Entscheidungsfindung

arXiv – cs.AI • 13.01.2026 05:00

LLM-gestützte Evolution liefert Steuerungsprogramme autonome Systeme