KI News: Kurz und klar.

Anmelden

Radiology's Last Exam (RadLE): Benchmarking Frontier Multimodal AI Against Human Experts and a Taxonomy of Visual Reasoning Errors in Radiology

arXiv – cs.AI • 01.10.2025 05:00 • Original

#multimodale KI #große Sprachmodelle #Vision Language Modelle #Medizinische Bildinterpretation #Benchmark #Radiologie #Fehlerklassifikation

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 02.02.2026 05:00

LLMs meistern Mathe‑Benchmarks, aber im Kontext bleiben sie hinterher

arXiv – cs.LG • 21.01.2026 05:00

R$^2$PO trennt Trainingspfade von Inferenzantworten und steigert LLM-Logik

arXiv – cs.AI • 09.01.2026 05:00

GUITester: Automatisierte GUI‑Tests mit KI – neue Benchmark und Framework

arXiv – cs.AI • 03.12.2025 05:00

Radiologist Copilot: KI-Assistent für präzises Radiologie-Reporting

arXiv – cs.AI • 27.11.2025 05:00

A^2Flow: Automatisierte Agenten-Workflow-Generierung mit adaptiven Operatoren

arXiv – cs.AI • 14.11.2025 05:00

SPAN: Benchmark für interkalenderische Zeitlogik von LLMs