Semi-überwachter Ansatz erkennt KI-generierte Bilder über Architekturen hinweg
Die rasante Entwicklung von Bildgeneratoren wie StyleGAN, Midjourney und DALL‑E hat zu hochrealistischen synthetischen Bildern geführt, die die Authentizität digitaler Medien stark gefährden. Diese Generatoren basieren meist auf zwei Hauptarchitekturen – Generative Adversarial Networks (GANs) und Diffusion Models (DMs). Ein zentrales Problem der aktuellen Forensik besteht darin, dass Detektoren nicht über die Grenzen dieser Architekturen hinweg generalisieren können.
In einer theoretischen Analyse wird gezeigt, wie die unterschiedlichen Optimierungsziele von GANs und DMs zu verschiedenartigen Manifold‑Abdeckungen führen. GANs ermöglichen teilweise Abdeckung, was zu Randartefakten führt, während DMs eine vollständige Abdeckung erzwingen und dadurch übermäßige Glättungsmuster erzeugen. Diese Erkenntnisse bilden die Grundlage für einen neuen Ansatz.
Der „Triarchy Detector“ (TriDetect) ist ein semi‑überwachtes Verfahren, das die binäre Klassifikation erweitert, indem es latente architektonische Muster innerhalb der „Fake“-Klasse entdeckt. Durch eine ausgeglichene Cluster‑Zuweisung mittels des Sinkhorn‑Knopp‑Algorithmus und einen Mechanismus zur Konsistenzprüfung über verschiedene Ansichten hinweg lernt das Modell die fundamentalen Unterschiede der Architekturen. TriDetect wurde an zwei Standard‑Benchmarks sowie an drei realen Datensätzen getestet und übertraf damit 13 etablierte Baselines in Bezug auf die Cross‑Generator‑Generalisation.