Backdoor-Angriffe nutzen Hyperbolische Geometrie: Kurven als Schwachstelle

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Moderne KI‑Modelle, die ihre Daten in gekrümmten Räumen wie der hyperbolischen Geometrie abbilden, offenbaren ein bislang unentdecktes Sicherheitsrisiko. Durch die besondere Struktur dieser Räume entsteht eine asymmetrische Grenze, die Angreifer ausnutzen können, um Backdoor‑Trigger zu platzieren.

In der Nähe der Randebene wirken kleine Eingabeveränderungen für herkömmliche Detektoren kaum auffällig, führen jedoch zu enormen Verschiebungen im Repräsentationsraum des Modells. Diese Diskrepanz zwischen Eingabe‑ und Repräsentationsraum ermöglicht es Angreifern, ihre Trigger nahezu unsichtbar zu machen.

Die Analyse zeigt, dass Defensivmaßnahmen, die Punkte entlang des Radius nach innen ziehen, die Trigger unterdrücken können – allerdings auf Kosten der Modellempfindlichkeit in dieser Richtung. Das bedeutet, dass jede Abwehrstrategie ein Kompromiss zwischen Sicherheit und Leistungsfähigkeit eingehen muss.

Auf Basis dieser Erkenntnisse wurde ein geometrisch adaptiver Trigger entwickelt, der in verschiedenen Aufgaben und Architekturen getestet wurde. Die Ergebnisse bestätigen die theoretischen Vorhersagen: Der Angriffserfolg steigt gegen die Randebene, während herkömmliche Detektoren an Wirksamkeit verlieren. Diese Befunde legen eine spezifische Schwachstelle in nicht-euklidischen Modellen offen und liefern wertvolle Hinweise für die Gestaltung effektiver Verteidigungsmechanismen.

Ähnliche Artikel