Neues multimodales Datenset und Modell revolutionieren Augenheilkunde-Intelligenz
In der Augenheilkunde hat ein neues multimodales Datenset namens MM‑Retinal‑Reason die Messlatte für künstliche Intelligenz höher gelegt. Es kombiniert Bilddaten mit klinischen Informationen wie Hauptbeschwerden und Vorgeschichte und deckt sowohl einfache als auch komplexe Diagnoseaufgaben ab. Damit wird die bisher reine Bild‑Matching‑Logik durch ein echtes klinisches Denkmodell ersetzt.
Auf Basis dieses Datensatzes wurde das OphthaReason-Modell entwickelt, das nicht nur Bilder analysiert, sondern Schritt für Schritt erklärt, wie zu einer Diagnose gelangt wird. Einzigartig ist die Uncertainty‑Aware Dynamic Thinking‑Methode (UADT), die die Unsicherheit jedes Beispiels misst und die Tiefe der Analyse dynamisch anpasst. So kann das Modell bei einfachen Fällen schnell entscheiden und bei komplexeren Situationen tiefer nachforschen.
Die umfangreichen Tests zeigen, dass OphthaReason sowohl bei einfachen als auch bei anspruchsvollen Aufgaben die besten Ergebnisse erzielt – deutlich besser als generische multimodale Sprachmodelle. Damit ebnet es den Weg für eine realistischere, datenbasierte Augenheilkunde, die sowohl Bild- als auch Patientendaten integriert.