KI News: Kurz und klar.

Anmelden

HugAgent: Evaluating LLMs in Simulating Human-Like Individual Reasoning on Open-Ended Tasks

arXiv – cs.AI • 20.10.2025 05:00 • Original

#HugAgent #LLM #Künstliche Intelligenz #kognitive Wissenschaft #Individuelle Argumentation #Benchmark

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 19.09.2025 05:00

Neues Benchmark prüft Rationalität großer Sprachmodelle

Analytics Vidhya • 07.09.2025 15:13

Another BIG AI from China! LongCat-Flash Chat 560B

arXiv – cs.AI • 03.02.2026 05:00

Mehr aus Weniger lernen: REPCORE nutzt interne Zustände zur Benchmark-Kompression

arXiv – cs.AI • 03.02.2026 05:00

OpenGuanDan: Benchmark für komplexe Kartenstrategien mit unvollständiger Info

arXiv – cs.AI • 03.02.2026 05:00

Neues Benchmark deckt Schwächen großer Sprachmodelle im Mathematik‑Denken auf

arXiv – cs.AI • 30.01.2026 05:00

KI-Framework für kollaboratives Lernen: Adaptive LLMs mit Feedback-Mechanismen