Forschung
Crosscoders ermöglichen architekturübergreifenden Modellvergleich – LLM‑Erkenntnisse
Model‑Diffing, also der Vergleich interner Repräsentationen von Sprachmodellen, gilt als vielversprechende Methode, um sicherheitskritische…
arXiv – cs.AI