Neues Modell nutzt Motive für präzise Molekülvorhersagen mit wenigen Daten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Arzneimittelentwicklung und Materialforschung ist die Vorhersage von Molekülmerkmalen entscheidend, doch klassische Deep‑Learning‑Ansätze benötigen große Mengen gelabelter Daten, die häufig nicht vorliegen. Das neue Verfahren „Motif‑Driven Global‑Local Context Graph“ (M‑GLC) löst dieses Problem, indem es sowohl globale als auch lokale Kontextinformationen nutzt.

Auf globaler Ebene werden chemisch sinnvolle Motive – etwa Ringe oder funktionelle Gruppen – als Knoten eingeführt, die ein heterogenes, dreipartites Netzwerk bilden. Dieses Netzwerk verbindet Motive, Moleküle und Eigenschaften und erfasst damit weitreichende Zusammensetzungs­muster, die zwischen Molekülen mit gemeinsamen Motiven ausgetauscht werden können. Auf lokaler Ebene wird für jedes Molekül‑Eigenschaftspaar ein Subgraph erstellt und separat kodiert, sodass das Modell sich gezielt auf die wichtigsten Nachbar­moleküle und Motive konzentrieren kann.

Tests an fünf etablierten Few‑Shot‑Molecular‑Property‑Prediction‑Benchmarks zeigen, dass M‑GLC die führenden Methoden konsequent übertrifft. Die Ergebnisse unterstreichen, wie die Kombination aus globalem Motiv‑Wissen und fein abgestimmtem lokalem Kontext die Zuverlässigkeit von Vorhersagen mit wenigen Daten deutlich verbessert.

Ähnliche Artikel