MolSculpt: 3D‑Moleküle aus chemischer Syntax präzise modellieren

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die präzise Erzeugung von 3D‑Molekülgeometrien ist ein entscheidender Schritt in der Wirkstoffentwicklung und Materialforschung. Traditionelle Ansätze nutzen 1D‑Darstellungen wie SELFIES, um die chemische Gültigkeit sicherzustellen, doch sie nutzen die tiefen chemischen Erkenntnisse, die in diesen 1D‑Modellen verborgen sind, nicht vollständig aus. MolSculpt schließt diese Lücke, indem es 3D‑Geometrien direkt aus chemischer Syntax „formt“.

Der Kern von MolSculpt besteht aus einem eingefrorenen 1D‑Molekül‑Fundamentmodell und einem 3D‑Molekül‑Diffusionsmodell. Durch ein Set lernbarer Abfragevektoren extrahiert das System das inhärente chemische Wissen aus dem Fundamentmodell. Ein trainierbarer Projektor überträgt diese Informationen in den Konditionsraum des Diffusionsmodells, wodurch die 3D‑Geometrie‑Generierung gezielt gesteuert wird. Auf diese Weise wird das 1D‑chemische Wissen nahtlos in den 3D‑Erzeugungsprozess integriert und das Modell kann end-to-end optimiert werden.

Experimentelle Ergebnisse zeigen, dass MolSculpt den aktuellen Stand der Technik bei der „de‑novo“ 3D‑Molekülgenerierung sowie bei bedingten 3D‑Molekülgenerierungen übertrifft. Die Modelle liefern eine herausragende 3D‑Treue und Stabilität auf den Datensätzen GEOM‑DRUGS und QM9. Der Code ist öffentlich zugänglich unter https://github.com/SakuraTroyChen/MolSculpt.

Ähnliche Artikel