ALSO: Neuer Optimierer verbindet robuste Verteilung mit Deep‑Learning‑Praxis

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der aktuellen Forschungsliteratur wird deutlich, dass klassische Deep‑Learning‑Optimierer alle Trainingsbeispiele gleich behandeln, während Distributionally Robust Optimization (DRO) jedem Sample unterschiedliche Gewichtungen zuweist. Diese theoretische Stärke steht jedoch im Widerspruch zu den Anforderungen moderner Deep‑Learning‑Workflows, die adaptive Verfahren und die Handhabung stochastischer Gradienten benötigen.

Darüber hinaus ist es für praxisnahe Anwendungen wichtig, Gewichtungen nicht nur einzelnen Samples, sondern auch ganzen Gruppen – etwa allen Daten eines bestimmten Klassenlabels – zuzuordnen. Um diese Lücke zu schließen, stellt die neue Arbeit den Adaptive Loss Scaling Optimizer (ALSO) vor. Dieser Optimierer erweitert das DRO‑Konzept um eine adaptive Gewichtungslogik, die sowohl einzelne Samples als auch Gruppen berücksichtigt.

Die Autoren zeigen theoretisch, dass ALSO bei nicht‑konvexen Zielsetzungen – dem typischen Fall bei Deep‑Learning‑Modellen – konvergiert. In umfangreichen Experimenten, die von tabellarischen Deep‑Learning‑Aufgaben bis hin zu Split‑Learning‑Szenarien reichen, übertrifft ALSO sowohl herkömmliche Optimierer als auch bestehende DRO‑Methoden in Bezug auf Genauigkeit und Stabilität.

Ähnliche Artikel