KI News: Kurz und klar.

Anmelden

CancerGUIDE: Cancer Guideline Understanding via Internal Disagreement Estimation

arXiv – cs.LG • 10.09.2025 05:00 • Original

#NCCN #LLM #NSCLC #Oncology #Guideline-concordant #Dataset #Benchmark

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 03.02.2026 05:00

Neues Benchmark deckt Schwächen großer Sprachmodelle im Mathematik‑Denken auf

arXiv – cs.AI • 03.02.2026 05:00

Mehr aus Weniger lernen: REPCORE nutzt interne Zustände zur Benchmark-Kompression

arXiv – cs.AI • 29.01.2026 05:00

ECG-Agent: Der erste LLM-basierte Tool-Calling-Agent für mehrfache ECG-Dialoge

arXiv – cs.AI • 29.01.2026 05:00

AMA: Adaptive Memory durch Multi-Agenten-Kollaboration

arXiv – cs.AI • 27.01.2026 05:00

LLMs können Enterprise-ETL SQL wirklich debuggen? UnserBench zeigt die Grenzen

arXiv – cs.AI • 27.01.2026 05:00

DeepPlanning: Benchmark für Agentenplanung mit überprüfbaren Grenzen