Domain Expansion: Neues Framework für Multi-Task‑Lernen ohne latente Kollaps
Beim Training eines einzigen Netzwerks mit mehreren Aufgaben treten häufig widersprüchliche Gradienten auf, die die gemeinsamen Repräsentationen schwächen. Das führt zu einem „latenten Kollaps“, bei dem das Modell für k…