Neues Stress-Testverfahren prüft ethische Robustheit von Sprachmodellen
Die Bewertung der ethischen Stabilität großer Sprachmodelle (LLMs) in realen Softwaresystemen bleibt bislang schwierig, besonders wenn Nutzer systematisch versuchen, das Modell zu manipulieren. Traditionelle Sicherheits…