Adaptive Steuerung gefrorener LLMs: Online Prompt Routing für soziale Alignment
In der aktuellen Forschung wird deutlich, dass große Sprachmodelle (LLMs) üblicherweise nach dem Training mit Verfahren wie RLHF oder DPO ausgerichtet werden. Diese Vorgehensweise führt zu einer fast statischen Entschei…