MOSAIC: Mehrsprachige, taxonomieunabhängige Radiologie-Report-Klassifikation
Radiologieberichte enthalten wertvolle klinische Informationen, die ohne teure manuelle Annotationen zur Schulung von Bildverarbeitungsmodellen genutzt werden können. Traditionelle Ansätze stoßen dabei an Grenzen: regelbasierte Systeme kämpfen mit sprachlicher Vielfalt, überwachte Modelle benötigen große annotierte Datensätze, und aktuelle LLM‑Lösungen sind oft proprietär oder ressourcenintensiv und daher für den klinischen Einsatz ungeeignet.
Mit MOSAIC wird diese Lücke geschlossen. Das System basiert auf dem kompakten, offenen Sprachmodell MedGemma‑4B und ist sowohl mehrsprachig als auch taxonomieunabhängig. Es unterstützt Zero‑/Few‑Shot‑Prompting sowie leichtgewichtiges Fine‑Tuning, sodass es auf handelsüblichen GPUs mit nur 24 GB VRAM betrieben werden kann.
In einer umfassenden Evaluation wurden sieben Datensätze in Englisch, Spanisch, Französisch und Dänisch – über verschiedene Bildmodalitäten und Label‑Taxonomien hinweg – getestet. MOSAIC erzielte einen durchschnittlichen Macro‑F1‑Score von 88 bei fünf Röntgen‑Thorax‑Datensätzen, was einer oder sogar einer überlegenen Expertenleistung entspricht. Mit Datenaugmentation konnten bereits 80 annotierte Beispiele ausreichen, um auf dänischen Berichten einen gewichteten F1‑Score von 82 zu erreichen, im Vergleich zu 86 bei einem vollständigen Trainingsset von 1 600 Stichproben.
Damit bietet MOSAIC eine praktikable Alternative zu großen, proprietären LLMs in klinischen Umgebungen. Der Code und die Modelle sind Open‑Source, und die Entwickler laden die Community ein, das System auf neue Sprachen, Taxonomien und Anwendungsfälle zu erweitern.