Neue Methode steigert Robustheit: Collaborative Ensemble Adversarial Training
Ein neues Verfahren namens Collaborative Ensemble Adversarial Training (CEAT) verspricht, die Widerstandsfähigkeit von Modellen gegen gezielte Angriffe deutlich zu erhöhen. Im Gegensatz zu bisherigen Ensemble-Adversarial-Training-Ansätzen, die die einzelnen Teilmodelle unabhängig voneinander trainieren, nutzt CEAT die Zusammenarbeit zwischen den Modellen, um besonders anfällige Datenpunkte gezielt zu verbessern.
Die Idee hinter CEAT ist, dass Beispiele, bei denen die Teilmodelle stark unterschiedliche Vorhersagen liefern, nahe an der Entscheidungsgrenze des Ensembles liegen und damit einen großen Einfluss auf die Gesamtrobustheit haben. CEAT legt daher diesen Beispielen mehr Gewicht bei der adversarialen Schulung der anderen Teilmodelle zu. Durch die adaptive Gewichtung basierend auf den Wahrscheinlichkeitsunterschieden und einer zusätzlichen Distanzregularisierung wird die Lernschwerpunktsetzung optimiert.
Umfangreiche Tests auf gängigen Datensätzen zeigen, dass CEAT die bisher beste Leistung im Vergleich zu anderen Ensemble-Adversarial-Training-Methoden erzielt. Das Verfahren ist modellunabhängig und lässt sich problemlos in verschiedene Ensemble-Architekturen integrieren, was seine Anwendbarkeit in vielen Bereichen der künstlichen Intelligenz erhöht.