MCMC-Ansatz steigert Vielfalt bei Protein-Design um 5‑fach

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neuer Ansatz namens Relaxed Sequence Sampling (RSS) nutzt Markov-Chain-Monte‑Carlo, um die Vielfalt von Protein‑Designs deutlich zu erhöhen. Im Gegensatz zu bisherigen Methoden, die sich auf lineare Gradientenoptimierung beschränken, kombiniert RSS kontinuierliche Logit‑Berechnungen mit gezielten Sprüngen, die von Protein‑Sprachmodellen vorgegeben werden.

Die Energiefunktion von RSS verbindet strukturelle Ziele, die aus AlphaFold2 abgeleitet werden, mit evolutionären Prioritäten, die aus dem ESM2‑Modell stammen. So wird eine Balance zwischen Genauigkeit und biologischer Plausibilität geschaffen, ohne die Rechenzeit zu erhöhen.

In einer Simulation zur Gestaltung von Protein‑Bindern konnte RSS fünfmal mehr designbare Strukturen erzeugen und die strukturelle Vielfalt um zwei bis drei Mal steigern als herkömmliche Relaxed Sequence Optimization (RSO). Diese Ergebnisse zeigen, dass RSS ein effektiver Weg ist, das Design‑Landschaft von Proteinen systematisch und effizient zu erkunden.

Ähnliche Artikel