CV‑Masking: Volatilitätsbewusste Maskierung verbessert EHR‑Modelle

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Masked Autoencoders (MAEs) werden zunehmend eingesetzt, um aus elektronischen Gesundheitsakten (EHR) allgemeine Repräsentationen zu lernen, die vielfältige klinische Aufgaben unterstützen. Traditionelle Ansätze maskieren jedoch zufällig, was impliziert, dass alle Messwerte gleichermaßen vorhersagbar sind. In Wirklichkeit zeigen Laborparameter eine große Volatilitäts­unterschiede: stabile Biomarker wie Natrium bleiben konstant, während volatile Werte wie Laktat stark schwanken und schwerer zu modellieren sind. Volatile Biomarker deuten häufig auf akute Pathophysiologie hin und erfordern deshalb ein differenzierteres Modellierungs­verhalten.

Die neue Strategie „Coefficient of Variation Masking“ (CV‑Masking) passt die Maskierungs­wahrscheinlichkeiten adaptiv an die inhärente Variabilität jedes Features an. Kombiniert mit einem ausschließlich wertbasierten Maskierungsziel, das den klinischen Arbeitsabläufen entspricht, liefert CV‑Masking systematische Verbesserungen gegenüber zufälliger und varianzbasierter Maskierung. Experimente mit einer großen Palette von Laborwerten zeigen, dass CV‑Masking die Rekonstruktion verbessert, die Leistung bei nachgelagerten Vorhersageaufgaben steigert und die Konvergenz beschleunigt. Das Ergebnis sind robustere und klinisch sinnvollere Repräsentationen für EHR‑Modelle.

Ähnliche Artikel