KI News: Kurz und klar.

Anmelden

APTBench: Benchmarking Agentic Potential of Base LLMs During Pre-Training

arXiv – cs.AI • 29.10.2025 04:00 • Original

#LLM #Agenten #Vorkonditionierung #Benchmark #Agentische Fähigkeiten #Planung #Softwareentwicklung #Forschung

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 03.02.2026 05:00

Neues Benchmark deckt Schwächen großer Sprachmodelle im Mathematik‑Denken auf

arXiv – cs.AI • 03.02.2026 05:00

Mehr aus Weniger lernen: REPCORE nutzt interne Zustände zur Benchmark-Kompression

arXiv – cs.AI • 03.02.2026 05:00

Agentische Evolution: Der Schlüssel zur Weiterentwicklung von LLMs

arXiv – cs.AI • 02.02.2026 05:00

PerfGuard: Agent für visuelle Inhalte, der Tool-Performance berücksichtigt

arXiv – cs.AI • 02.02.2026 05:00

<p>LLM-Agenten zeigen beeindruckende Schritt-für-Schritt‑Logik bei kurzen Aufgaben, doch sobald die Planung mehrere Schritte vorausgehen muss, geraten sie in eine myope Haltung. In einer neuen Analyse wird erklärt, warum diese „greedy“ Vorgehensweise bei langen Entscheidungswegen versagt: Jede Aktion wird nur im Blick des nächsten Schritts bewertet, ohne die verzögerten Konsequenzen zu berücksichtigen.</p>

arXiv – cs.AI • 29.01.2026 05:00

AMA: Adaptive Memory durch Multi-Agenten-Kollaboration