engGNN: Zweifach-Graph-Netzwerk revolutioniert Omics‑Diagnostik

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Omics‑Daten wie Transkriptomik, Proteomik und Metabolomik liefern entscheidende Einblicke in Krankheitsmechanismen, doch ihre enorme Dimensionalität, die geringen Stichprobengrößen und die komplexen biologischen Netzwerke erschweren zuverlässige Vorhersagen und sinnvolle Interpretationen.

Graph Neural Networks (GNNs) ermöglichen die Einbettung von Vorwissen, indem sie Merkmalsbeziehungen als Graphen kodieren. Bisher basieren die meisten Ansätze jedoch ausschließlich auf einem extern kuratierten Feature‑Graphen oder einem ausschließlich datengetriebenen Graphen, was die Erfassung ergänzender Informationen limitiert.

Die neue Methode engGNN nutzt ein duales Graphen‑Framework: einen biologisch informierten, ungerichteten Feature‑Graphen aus etablierten Netzwerkdatenbanken und einen gerichteten Feature‑Graphen, der aus Baum‑Ensemble‑Modellen abgeleitet wird. Durch die Kombination beider Graphen entstehen umfassendere Einbettungen, die die Vorhersageleistung steigern und die Interpretierbarkeit verbessern.

In umfangreichen Simulationen und realen Anwendungen auf Genexpressionsdaten übertrifft engGNN konsequent die führenden Baselines. Zusätzlich liefert es interpretierbare Feature‑Wichtigkeit‑Scores, die biologisch sinnvolle Entdeckungen wie Pfad‑Enrichment‑Analysen ermöglichen. Diese Ergebnisse unterstreichen engGNN als robuste, flexible und interpretierbare Lösung für die Omics‑basierte Krankheitsklassifikation und Feature‑Auswahl.

Ähnliche Artikel