KI-gestützter Assistent sichert langfristigen Zugriff auf RHIC-Wissen
Der Relativistic Heavy Ion Collider (RHIC) am Brookhaven National Laboratory feiert nach 25 Jahren Betrieb einen Meilenstein: neben der Erhaltung von rund 1 Exabyte an Daten wird nun auch das darin verborgene wissenschaftliche Wissen systematisch gesichert. Das neue RHIC Data and Analysis Preservation Plan (DAPP) setzt dafür auf einen KI-gestützten Assistenten, der über natürliche Sprache auf Dokumentationen, Arbeitsabläufe und Software zugreift.
Der Assistent nutzt moderne Large Language Models in Kombination mit Retrieval-Augmented Generation und dem Model Context Protocol. Dadurch werden strukturierte und unstrukturierte Inhalte aus den RHIC-Experimenten indiziert und in einer domänenspezifischen Umgebung nutzbar gemacht. Nutzer können so komplexe Fragestellungen stellen und erhalten präzise Antworten, die die Reproduzierbarkeit von Ergebnissen, die Ausbildung neuer Forscher und die Entdeckung neuer Zusammenhänge fördern.
Die Implementierung wurde bereits in mehreren Experimenten getestet und zeigt eine stabile Leistung bei gleichzeitig hoher Erklärbarkeit. Die Architektur des Systems ist darauf ausgelegt, langfristig wartbar zu bleiben und die KI-Interaktion transparent zu gestalten. Damit demonstriert das Projekt, wie moderne KI- und ML-Tools die Nutzbarkeit und Auffindbarkeit von wissenschaftlichen Legacy-Daten revolutionieren können.