Neue Batch-Distillationsdatenbank eröffnet ML-gestützte Anomalieerkennung
Ein neues, umfangreiches Datenset aus Laborbatch-Distillationsprozessen steht jetzt frei zur Verfügung. Die Datenbank umfasst 119 Experimente, die unter einer breiten Palette von Betriebsbedingungen durchgeführt wurden. Für jedes experimentelle Setup wurden sowohl fehlerfreie als auch absichtlich induzierte Anomalien erfasst, sodass ein direktes Vergleichs- und Trainingsmaterial für maschinelles Lernen entsteht.
Die Sammlung enthält Zeitreihen von zahlreichen Sensoren und Aktuatoren, ergänzt durch Messunsicherheitsabschätzungen. Zusätzlich werden unkonventionelle Datenquellen bereitgestellt, darunter Online-NMR-Konzentrationsprofile sowie Video- und Audioaufzeichnungen. Jede Messreihe ist mit umfangreichen Metadaten und Expertenannotationen versehen, die auf einer eigens entwickelten Ontologie basieren.
Durch die offene Verfügbarkeit der Daten über Zenodo (doi.org/10.5281/zenodo.17395544) können Forscher nun fortschrittliche ML-Methoden zur Anomalieerkennung entwickeln und testen. Die detaillierten Anomalieannotationen ermöglichen zudem die Erstellung interpretierbarer und erklärbarer Modelle sowie Strategien zur Anomalie-Minderung.