Basismodelle bei Zeitreihen: Wann sie glänzen – mit automatisierten Erklärungen
In einer aktuellen Untersuchung aus dem arXiv-Preprint arXiv:2508.20437v1 wird die Frage beantwortet, warum und wann sogenannte Foundation‑Modelle bei der Vorhersage von Zeitreihen wirklich überzeugen. Die Autoren kombinieren klassische erklärbare KI‑Methoden mit einem neuen Ansatz namens Rating Driven Explanations (RDE), um die Leistung und Interpretierbarkeit von Modellen aus unterschiedlichen Bereichen systematisch zu bewerten.
Vier Modellarchitekturen stehen im Fokus: das traditionelle ARIMA, Gradient Boosting, das auf Zeitreihen spezialisierte Foundation‑Modell Chronos und das generische Llama‑Modell – sowohl in seiner Basis‑ als auch in seiner feinabgestimmten Version. Diese Modelle werden auf vier heterogenen Datensätzen aus den Bereichen Finanzen, Energie, Transport und Automobilverkauf getestet.
Die Ergebnisse sind eindeutig: Feature‑Engineered‑Modelle wie Gradient Boosting schneiden in volatilen oder sparsamen Domänen – etwa bei Strompreisen oder Autoteileverkäufen – konsequent besser ab und liefern gleichzeitig klarere, nachvollziehbare Erklärungen. Foundation‑Modelle hingegen zeigen ihre Stärken nur in stabilen, trendgetriebenen Kontexten, etwa bei Finanzdaten, wo sie die langfristige Entwicklung zuverlässig erfassen.
Die Studie liefert damit wertvolle Erkenntnisse für Praktiker, die Zeitreihenprognosen einsetzen, um Entscheidungen mit realen Konsequenzen zu treffen. Sie zeigt, dass die Wahl des Modells stark vom Anwendungsfall abhängt und dass automatisierte Erklärungen und Bewertungen ein entscheidendes Instrument sind, um die Vertrauenswürdigkeit und Transparenz dieser komplexen Systeme zu erhöhen.