Forschung
Diversity-Aware Reverse Kullback-Leibler Divergenz für LLM-Distillation
Die Reverse Kullback-Leibler (RKL)-Divergenz hat sich in den letzten Monaten als das bevorzugte Ziel für die Distillation großer Sprachmode…
arXiv – cs.LG