<strong>Mehr Infos nicht immer besser: Kompression von KV‑Caches spart bis zu 90 % Kommunikation</strong>
In modernen Multi‑Agent‑Systemen, die auf großen Sprachmodellen (LLMs) basieren, wird die Kommunikation zunehmend über latente Nachrichten statt über reine Token abgewickelt. Der aktuelle Ansatz LatentMAS lässt Agenten…