Steuerbar, aber nicht dekodierbar: Funktionsvektoren jenseits der Logit‑Linse
In einer wegweisenden Studie, die auf arXiv veröffentlicht wurde, zeigen Forscher, dass Funktionsvektoren (FVs) große Sprachmodelle steuern können, selbst wenn die Logit‑Linse keine korrekten Antworten liefern kann. Die…