Neue Methode enthüllt versteckte Modularität in Transformers
Transformers zeigen bislang eine erstaunliche Widerstandsfähigkeit gegen gezielte Eingriffe: Wenn ein als entscheidend identifiziertes Aufmerksamkeitskopf abgelöscht wird, verändert sich das Verhalten des Modells kaum…