Forschung
Turbo-Muon: Preconditionierung beschleunigt orthogonale Optimierung
Orthogonality-basierte Optimierer wie Muon haben in den letzten Monaten beeindruckende Ergebnisse bei groß angelegten Trainingsaufgaben erz…
arXiv – cs.AI