EEG‑D3 löst verstecktes Overfitting bei Deep‑Learning‑Modellen

arXiv – cs.LG Original ≈2 Min. Lesezeit
Anzeige

Deep‑Learning‑Modelle zur Dekodierung von EEG‑Signalen erzielen beeindruckende Ergebnisse auf kontrollierten BCI‑Benchmarks, doch ihre Leistung in realen Anwendungen bleibt oft hinter den Erwartungen zurück. Der Grund liegt in verstecktem Overfitting: Modelle lernen nicht nur die eigentlichen Gehirnaktivitäten, sondern auch artefaktbezogene Muster, die in den Trainingsdaten vorhanden sind, aber im Alltag nicht auftreten.

Um dieses Problem zu bekämpfen, stellt die neue Methode Disentangled Decoding Decomposition (D3) vor. D3 ist ein schwach überwachtetes Verfahren, das die Position eines Eingabefensters innerhalb eines Trials vorhersagt. Durch diese Vorhersage trennt D3 latente Komponenten der Gehirnaktivität – ähnlich einer nichtlinearen ICA – und nutzt dafür ein Architekturdesign mit vollständig unabhängigen Sub‑Netzwerken, das eine klare Interpretierbarkeit gewährleistet.

Die Autoren haben ein Feature‑Interpretationsparadigma entwickelt, um die Aktivierungsprofile der Komponenten über verschiedene Datensätze hinweg zu vergleichen und die zugehörigen zeitlichen sowie räumlichen Filter zu untersuchen. Auf Motor‑Imagery‑Daten konnte D3 zuverlässig die latenten Komponenten trennen. Wenn anschließend Klassifikatoren nur auf einer geeigneten Teilmenge dieser Komponenten trainiert werden, verhindert man das versteckte Overfitting, das bei End‑to‑End‑Modellen häufig auftritt.

Ein weiterer Vorteil von D3 ist die lineare Trennbarkeit des latenten Raums, die es ermöglicht, mit wenigen Beispielen neue Aufgaben zu erlernen – beispielsweise die Klassifikation von Schlafstadien. Durch die klare Unterscheidung echter Gehirnaktivitäten von spurious Features erzeugen die Modelle eine robuste Generalisierung und sind damit besser für den Einsatz in realen, unkontrollierten Umgebungen geeignet.

Ähnliche Artikel