KI-gestützte ADR‑Missionsplanung: Robustheit vs. Anpassungsfähigkeit
In einer neuen Studie aus dem arXiv‑Repository wird die Leistungsfähigkeit von KI‑basierten Planern für die aktive Beseitigung von Weltraummüll (ADR) untersucht. Dabei stehen Effizienz, Anpassungsfähigkeit und die Einhaltung strenger Treibstoff‑ und Zeitvorgaben im Fokus.
Die Autoren vergleichen drei Ansätze für das Problem der Mehrdebris‑Rendezvous‑Missionen in der niedrigen Erdumlaufbahn. Erstens ein klassisches Masked Proximal Policy Optimization (PPO) – ein lernender Planner, der unter festen Missionsparametern trainiert wurde. Zweitens ein domänenrandomisierter Masked PPO, der über ein breites Spektrum an Missionseinschränkungen hinweg trainiert wurde, um die Robustheit zu erhöhen. Drittens ein einfacher Monte‑Carlo‑Tree‑Search (MCTS) als Baseline, der online replaniert.
Die Tests wurden in einer hochpräzisen Orbital‑Simulation durchgeführt, die realistische Transfer‑Dynamiken, Betankung und zufällige Müllfelder simuliert. Insgesamt wurden 300 Szenarien evaluiert, die nominale, reduzierten Treibstoff‑ und reduzierte Missionszeitbedingungen abdecken. Die Ergebnisse zeigen, dass der klassische PPO bei Übereinstimmung der Trainingsbedingungen Spitzenleistungen erzielt, jedoch bei Abweichungen stark nachlässt. Der domänenrandomisierte PPO demonstriert eine deutlich verbesserte Anpassungsfähigkeit, während die Leistung im nominalen Fall nur moderat sinkt. MCTS hingegen bleibt robust gegenüber Änderungen der Einschränkungen, erfordert jedoch viel höhere Rechenzeit.
Die Studie unterstreicht den klassischen Kompromiss zwischen der Geschwindigkeit von lernbasierten Planern und der Flexibilität von suchbasierten Methoden. Ein vielversprechender Ansatz für zukünftige ADR‑Planer könnte die Kombination von Trainingszeit‑Diversität mit Online‑Planung sein, um sowohl Effizienz als auch Resilienz zu maximieren.