IMPQ: Interaction-Aware Layerwise Mixed Precision Quantization for LLMs

arXiv – cs.LG Original
Anzeige

Ähnliche Artikel