KI News: Kurz und klar.

Anmelden

Microsoft AI Introduces rStar2-Agent: A 14B Math Reasoning Model Trained with Agentic Reinforcement Learning to Achieve Frontier-Level Performance

MarkTechPost • 30.08.2025 07:41 • Original

#große Sprachmodelle #Chain-of-Thought #mathematisches Denken #Fehlererkennung #Microsoft KI #rStar2-Agent

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 28.01.2026 05:00

Verbessern Sie LLM‑Logik: Präzise Fehlerstrafe mit Prozess‑überwachtem RL

arXiv – cs.AI • 18.12.2025 05:00

LLM mit kritischer Denkweise: Stepwise Think-Critique verbessert Problemlösung

arXiv – cs.AI • 27.11.2025 05:00

Pessimistische Verifikation steigert Genauigkeit bei offenen Matheaufgaben

arXiv – cs.AI • 11.11.2025 05:00

SofT-GRPO: Soft-Thinking-LLMs übertreffen klassische Token-basierte RL-Methoden

arXiv – cs.AI • 22.10.2025 05:00

Illusions of reflection: open-ended task reveals systematic failures in Large Language Models' reflective reasoning

arXiv – cs.AI • 13.10.2025 05:00

ArXiv-Paper enthüllt Architektur autonomer LLM-Agenten