Sprachmodelle: Prompt-Injection gelingt dank Rollenverwirrung
Obwohl Sprachmodelle umfangreiche Sicherheitstrainings durchlaufen, bleiben sie weiterhin anfällig für Prompt‑Injection‑Angriffe. In einer neuen Studie wird die Ursache auf ein Phänomen namens Rollenverwirrung zurückgeführt: Modelle bestimmen, wer „spricht“, anhand des Schreibstils, nicht anhand de…