Forschung
DAQ: Delta-Aware Quantisierung kompaktiert LLM-Gewichte ohne Wissensverlust
Ein neues Verfahren namens Delta-Aware Quantization (DAQ) wurde auf arXiv veröffentlicht und verspricht, die Kompression von Sprachmodellen…
arXiv – cs.LG