PoolFlip: Mehragenten‑Umgebung für KI‑gestützte Cyberabwehr
Die Verteidigung von IT‑Systemen erfordert zunehmend automatisierte Entscheidungen, wenn Angreifer ihre Aktionen verschleiern, täuschen und sich ständig weiterentwickeln. Das FlipIt‑Spiel bildet seit langem die Grundlage für die Modellierung von Interaktionen zwischen Verteidiger und fortgeschrittenem Angreifer, der ein gemeinsames Ziel kontrolliert, ohne sofort entdeckt zu werden. Dabei konkurrieren die beiden Parteien um die Kontrolle über eine Ressource, indem sie Flip‑Aktionen ausführen und dafür Kosten tragen.
Aktuelle FlipIt‑Frameworks stützen sich jedoch meist auf wenige Heuristiken oder spezialisierte Lernmethoden, was zu einer hohen Anfälligkeit und einer schlechten Anpassungsfähigkeit an neue Angriffe führt. Um diese Schwächen zu beheben, wurde PoolFlip entwickelt – eine Multi‑Agent‑Gym‑Umgebung, die das FlipIt‑Spiel erweitert und sowohl Angreifer als auch Verteidiger effizient lernen lässt.
Darüber hinaus wurde Flip‑PSRO eingeführt, ein Multi‑Agent‑Reinforcement‑Learning‑Ansatz, der population‑basierte Trainingsmethoden nutzt. Damit werden Verteidiger trainiert, die gegen eine Vielzahl unbekannter, potenziell adaptiver Gegner generalisieren können. In Experimenten zeigte sich, dass Flip‑PSRO‑Verteidiger doppelt so effektiv sind wie Basis‑Methoden, wenn sie mit einem heuristischen Angriff konfrontiert werden, der im Training nicht vorkam.
Ein weiterer Beitrag von PoolFlip ist die Einführung von Eigentums‑basierten Nutzenfunktionen. Diese sorgen dafür, dass die Verteidiger ein hohes Maß an Kontrolle behalten, während sie gleichzeitig ihre Leistung optimieren. Insgesamt bietet PoolFlip damit ein robustes, skalierbares Umfeld für die Entwicklung und Evaluierung von KI‑gestützten Cyberabwehrstrategien.