Forschung
KD-MARL: Wissensdistillation für ressourcenschonende Multi-Agenten-LL
Die praktische Anwendung von Multi-Agenten‑Reinforcement‑Learning (MARL) wird durch begrenzte Rechenleistung, Speicher und Inferenzzeit sta…
arXiv – cs.AI