Dynamische Auswahl & rekonstruktives Pre‑Training verbessern Proteinvorhersage

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Verfahren namens DSRPGO nutzt dynamische Auswahl und rekonstruktives Pre‑Training, um die Vorhersage von Proteinfunktionen auf Basis multimodaler Daten zu optimieren. Durch das rekonstruktive Pre‑Training werden feinere, semantisch niedrigere Informationen aus strukturellen, sequentiellen und netzwerkbasierten Merkmalen extrahiert.

Das Modell integriert zudem das Bidirectional Interaction Module (BInM), das eine wechselseitige Lerninteraktion zwischen den verschiedenen Modalitäten ermöglicht. Damit werden die unterschiedlichen Informationsquellen besser zusammengeführt.

Um die Herausforderung der hierarchischen Mehrlabels-Klassifikation zu bewältigen, kommt ein Dynamic Selection Module (DSM) zum Einsatz. Dieses wählt die für die aktuelle Vorhersage am besten geeignete Feature‑Repräsentation aus.

In Tests mit menschlichen Datensätzen erzielt DSRPGO signifikante Verbesserungen in den Bereichen Biological Process Ontology (BPO), Molecular Function Ontology (MFO) und Cellular Component Ontology (CCO) und übertrifft damit bisherige Benchmark‑Modelle.

Ähnliche Artikel