Transformers lernen Planung durch Mehr-Token-Vorhersage
Eine neue Untersuchung auf arXiv zeigt, dass Transformer‑Modelle mit einer Mehr‑Token‑Vorhersage (MTP) deutlich besser in der Lage sind, komplexe Planungsaufgaben zu lösen als die herkömmliche Next‑Token‑Prediction (NTP…