TransConv-DDPM: Neues Diffusionsmodell erzeugt medizinische Zeitreihen
In der klinischen Forschung fehlt es häufig an realen Daten, was die Entwicklung leistungsfähiger KI‑Modelle für Diagnose und Prävention erschwert. Generative KI hat in Bereichen wie Bildverarbeitung und Sprachverarbeitung bereits gezeigt, dass sie Datenmengen vergrößern und Trainingsprozesse verbessern kann. Für physiologische Zeitreihen – ein zentrales Datenformat in der medizinischen KI – stellen jedoch Komplexität und Variabilität besondere Herausforderungen dar.
Das neue Modell TransConv-DDPM kombiniert einen Denoising Diffusion Probabilistic Model (DDPM) mit einer U‑Net‑Architektur, multi‑skaligen Convolution‑Modulen und einem Transformer‑Layer. Diese Kombination ermöglicht es, sowohl globale als auch lokale zeitliche Abhängigkeiten in den Daten zu erfassen und damit realistischere Zeitreihen zu erzeugen.
Bei Tests auf drei unterschiedlichen Datensätzen, darunter SmartFallMM und EEG, zeigte TransConv-DDPM deutlich bessere Ergebnisse als die führenden Methoden TimeGAN und Diffusion‑TS. Besonders bei den SmartFallMM‑ und EEG‑Datensätzen konnte das Modell die allmählichen Veränderungen zwischen den Messpunkten präziser abbilden. Ein praktischer Nutzen wurde durch einen Test auf SmartFallMM demonstriert: Die Integration synthetisch generierter Sturz‑Daten verbesserte die Vorhersageleistung eines Modells um 13,64 % im F1‑Score und um 14,93 % in der Gesamtgenauigkeit im Vergleich zu einem Modell, das ausschließlich reale Sturz‑Daten verwendete.