Automatisierte Entdeckung von Aufmerksamkeitsmustern in großen Sprachmodellen
In der Welt der großen Sprachmodelle (LLMs) hat die Skalierung der Fähigkeiten zu bemerkenswerten Erfolgen geführt – von Textgenerierung bis hin zu komplexen Aufgaben. Doch die Interpretierbarkeit dieser Modelle bleibt…