Neue Methode testet Zuverlässigkeit von LLMs bei wiederholten Prompt-Generierungen
Traditionelle Benchmarks wie HELM und AIR‑BENCH bewerten die Sicherheit von großen Sprachmodellen (LLMs) vor allem über eine breite Aufgabenvielfalt. In der Praxis jedoch stellen sich andere Risiken ein: wiederholte Gen…