Forschung
SurfaceLogicKV: Mit Aufmerksamkeitsverhalten die KV-Cache‑Kompression optimieren
Die steigende Eingabesequenzlänge in großen Sprachmodellen belastet den Key‑Value‑Cache stark. Ein neues Verfahren namens SurfaceLogicKV nu…
arXiv – cs.AI