FaithSteer-BENCH: Stress-Test für LLM-Steuerung in realen Deployments
Die neue Benchmark „FaithSteer‑BENCH“ richtet sich an die Praxis der Inferenz‑Zeit‑Steuerung von großen Sprachmodellen (LLMs). Sie prüft, ob gezielte Aktivierungs‑Interventionen tatsächlich die gewünschte Verhaltensände…