Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use
arXiv – cs.AI
•
R-ConstraintBench: Neue Benchmark für LLMs bei NP‑Vollständigen Planungsaufgaben
arXiv – cs.AI
•
LLMs im Pokerspiel: Noch weit von Profis entfernt – ToolPoker setzt neue Maßstäbe
arXiv – cs.LG
•
RAPTOR: Neue Ridge-Logistikprobe verbessert Konzept-Analyse in LLMs
arXiv – cs.LG
•
Neue Methode optimiert lokale Sprachmodelle und Cloud‑Nutzung bei Budgetgrenzen
arXiv – cs.AI
•
Neues Benchmark deckt Schwächen großer Sprachmodelle im Mathematik‑Denken auf