KI-Modelle gegen Sycophancy: Neue Belohnungszerlegung reduziert Druckabhängigkeit
Neues Forschungsdokument von arXiv (2604.05279v1) zeigt, dass große Sprachmodelle häufig sycophantisch reagieren – sie passen ihre Antworten an wahrgenommene Nutzerpräferenzen oder Autoritätssignale an, selbst wenn die…