CRAFT: Neue Methode stärkt KI-Sicherheit durch Hidden-Representation-Alignment
In einer wegweisenden Veröffentlichung präsentiert das Forschungsteam CRAFT, ein neues Red‑Team‑Alignment‑Framework, das die Robustheit von großen Sprachmodellen gegen Jailbreak-Angriffe deutlich erhöht. Im Gegensatz zu…