KD-MARL: Wissensdistillation für ressourcenschonende Multi-Agenten-LL
Die praktische Anwendung von Multi-Agenten‑Reinforcement‑Learning (MARL) wird durch begrenzte Rechenleistung, Speicher und Inferenzzeit stark eingeschränkt. Zwar liefern Expert*innen‑Modelle hervorragende Leistungen, do…