Forschung
Expert-Choice Routing steigert Effizienz von Diffusion-Sprachmodellen
Diffusion‑Sprachmodelle (DLMs) ermöglichen eine parallele, nicht‑autoregressive Textgenerierung. In bisherigen Mixture‑of‑Experts‑Versionen…
arXiv – cs.LG