Neues KI-Modell verbessert Vorhersage von Molekül-Protein-Interaktionen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Forschungsprojekt aus dem Bereich der computergestützten Biologie hat ein innovatives Modell vorgestellt, das die Vorhersage von Molekül-Protein-Interaktionen (MPI) deutlich verbessert. Das System, genannt KGOT, kombiniert einen umfassenden Wissensgraphen mit einer optimalen Transportmethode zur Erzeugung von Pseudo‑Labels für bislang unbeschriftete Molekül‑Protein‑Paare.

Die Autoren betonen, dass die gängige MPI‑Forschung durch zwei zentrale Probleme eingeschränkt ist: Erstens fehlt es an ausreichend gelabelten Daten, und zweitens berücksichtigen die meisten Modelle nur die direkten Eigenschaften von Molekülen und Proteinen, ohne das breitere biologische Umfeld zu nutzen. KGOT löst diese Herausforderungen, indem es Daten aus verschiedenen Quellen – darunter Geninformationen, Stoffwechselwege und funktionelle Annotationen – zusammenführt und diese heterogenen Informationen in einem einheitlichen Graphen abbildet.

Durch die Anwendung von optimalem Transport werden die bekannten Interaktionsverteilungen genutzt, um für unbeschriftete Paare hochwertige Pseudo‑Labels zu generieren. Dieser Ansatz fungiert als Brücke zwischen den unterschiedlichen biologischen Modalitäten und ermöglicht es dem Modell, die Vielfalt der Daten effektiv zu nutzen. In umfangreichen Tests auf mehreren MPI‑Datensätzen, einschließlich virtueller Screening‑ und Protein‑Retrieval‑Aufgaben, erzielte KGOT signifikante Verbesserungen gegenüber aktuellen Spitzenmodellen und zeigte eine bemerkenswerte Zero‑Shot‑Fähigkeit bei unbekannten Interaktionen.

Das vorgestellte Verfahren eröffnet damit einen neuen Ansatz, um vielfältige biologische Datenquellen zu integrieren und die Genauigkeit von MPI‑Vorhersagen zu steigern – ein wichtiger Schritt für die Wirkstoffentwicklung und die funktionelle Annotation von Proteinen.

Ähnliche Artikel