Neue Erkenntnisse: SGD mit gieriger Schrittweite konvergiert schneller
Ein neues arXiv‑Papier liefert einen wichtigen Durchbruch in der Analyse von SGD mit gieriger Schrittweite. Die Autoren untersuchen die letzte Iteration bei glatten quadratischen Funktionen im Interpolationsregime – ein…