Neue Methode erkennt unbekannte Daten ohne Trainingsdaten – ClaFR setzt Maßstäbe
In der KI-Welt ist die Erkennung von Daten außerhalb des Trainingsbereichs – Out-of-Distribution (OOD) Detection – entscheidend für sichere Anwendungen. Traditionelle Verfahren nutzen oft die Trainingsdaten, was in datenschutzkritischen Szenarien problematisch ist.
Die neue Technik, die als Classifier-based Feature Reconstruction (ClaFR) bezeichnet wird, arbeitet völlig post-hoc. Sie zerlegt die Gewichte eines Klassifikators orthogonal, um einen klassenbekannten Unterraum zu extrahieren. Anschließend werden die ursprünglichen Datenmerkmale in diesen Unterraum projiziert, wodurch neue Repräsentationen entstehen.
Der OOD-Score wird dann durch die Berechnung des Rekonstruktionsfehlers innerhalb dieses Unterraums bestimmt. Dadurch kann ClaFR ohne Zugriff auf Trainingsdaten arbeiten und dennoch Spitzenleistungen auf mehreren OOD-Benchmarks erzielen.
Die Autoren haben den Code öffentlich zugänglich gemacht: https://github.com/Aie0923/ClaFR. Diese Entwicklung markiert einen wichtigen Schritt in Richtung datenschutzfreundlicher KI‑Sicherheit.