HydroGEM: KI-Modell für Qualitätskontrolle von Flussabflussdaten im Kontinent
HydroGEM, ein neues Foundation‑Modell, setzt neue Maßstäbe für die Qualitätskontrolle von Flussabflussdaten. Durch selbstüberwachtes Lernen ohne Vorwissen erkennt es Anomalien in Echtzeit‑Messnetzen, die jährlich Millionen von Beobachtungen liefern.
Das Modell wurde in zwei Schritten trainiert: Zunächst wurden 6,03 Millionen Zeitreihen von 3 724 USGS‑Stationsdaten selbstüberwacht, um robuste hydrologische Repräsentationen zu erlernen. Anschließend erfolgte ein Fein‑Tuning mit synthetisch erzeugten Anomalien, um sowohl die Erkennung als auch die Rekonstruktion von Fehlern zu optimieren.
HydroGEM kombiniert eine TCN‑(Temporal‑Convolutional‑Network)‑ und Transformer‑Architektur mit 14,2 Millionen Parametern. Durch hierarchische Normalisierung kann das Modell Flussmengen über sechs Größenordnungen hinweg verarbeiten und lokale sowie langfristige Muster gleichzeitig erfassen.
In synthetischen Tests mit 799 Stationsdaten und 18 Expertenvalidierten Anomalie‑Typen erreichte HydroGEM ein F1‑Score von 0,792 und reduzierte Rekonstruktionsfehler um 68,7 %. Das entspricht einer Verbesserung von 36,3 % gegenüber bestehenden Methoden. In einer Zero‑Shot‑Transfer‑Phase auf 100 kanadische Stationsdaten erzielte das Modell einen F1‑Score von 0,586 – deutlich besser als alle Vergleichsmodelle.
HydroGEM ist für den Einsatz in menschlich‑unterstützten Workflows konzipiert: Die Modelloutputs liefern Qualitätskontrollvorschläge, die von Experten überprüft werden, anstatt autonome Korrekturen vorzunehmen. Damit verbindet es die Leistungsfähigkeit moderner KI mit der notwendigen Fachkenntnis vor Ort.