Fein abgestimmte iterative Angriffe bei begrenztem Rechenbudget

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Studie auf arXiv wird ein entscheidendes Problem der KI‑Sicherheit unter eingeschränkten Rechenressourcen angegangen: Wie kann man bei festem Budget die Wirksamkeit iterativer Angriffe maximieren? Eine grobe Reduktion der Angriffsschritte spart Kosten, aber die Effektivität sinkt stark.

Die Autoren stellen einen fein abgestimmten Kontrollmechanismus vor, der gezielt die Aktivierungen einzelner Schichten sowohl über die Iterationen hinweg als auch innerhalb der Schichten neu berechnet. Durch diese selektive Re‑Berechnung bleibt die Rechenlast niedrig, während die Angriffsleistung erhalten bleibt.

Umfangreiche Experimente zeigen, dass das Verfahren bei gleichem Kostenaufwand konsequent die bestehenden Baselines übertrifft. Noch beeindruckender: In Kombination mit adversarialem Training erreicht es vergleichbare Ergebnisse, jedoch mit nur 30 % des ursprünglichen Budgets.

Ähnliche Artikel