CrystalICL: Kristallgenerierung mit wenigen Beispielen in Kontext
Die gezielte Gestaltung von Kristallmaterialien mit gewünschten physikalisch‑chemischen Eigenschaften bleibt eine zentrale Herausforderung in der Materialwissenschaft. Während große Sprachmodelle (LLMs) bereits beeindruckende Fähigkeiten im In‑Context‑Learning (ICL) gezeigt haben, beschränken sich bisherige LLM‑basierte Ansätze zur Kristallgenerierung auf Zero‑Shot‑Szenarien und können die Vorteile von Few‑Shot‑Lernen nicht nutzen.
Im Gegensatz dazu entwickeln Fachleute neue Materialien häufig, indem sie bekannte Strukturen anpassen – ein Vorgehen, das dem Few‑Shot‑ICL-Paradigma sehr nahekommt. Aus diesem Grund stellen wir CrystalICL vor, ein neuartiges Modell, das speziell für die Kristallgenerierung mit wenigen Beispielen konzipiert wurde.
CrystalICL nutzt eine tokenbasierte Darstellung, die auf Raumgruppen ausgerichtet ist. Diese Methode reduziert die Komplexität der Symmetriemodellierung erheblich und ermöglicht es dem LLM, die Strukturinformationen effizient zu verarbeiten. Darüber hinaus wurde ein hybrides, strukturbewusstes Instruction‑Tuning‑Framework sowie eine Multi‑Task‑Instruction‑Tuning‑Strategie entwickelt. Diese Ansätze erlauben es dem Modell, aus begrenzten Daten die Beziehungen zwischen Struktur und Eigenschaften besser zu erfassen und dadurch die ICL-Fähigkeiten zu maximieren.
Umfangreiche Tests an vier etablierten Kristallgenerierungsbenchmarks zeigen, dass CrystalICL sowohl bei bedingten als auch bei unbedingten Generierungsaufgaben die führenden Baselines deutlich übertrifft. Damit eröffnet CrystalICL neue Möglichkeiten für die effiziente und gezielte Entwicklung von Kristallmaterialien.