Linear Probe Genauigkeit steigt mit Modellgröße – Multi‑Layer‑Ensembling hilft
Eine neue Studie aus dem arXiv zeigt, dass linear probes – einfache Klassifikatoren, die auf den Aktivierungen von Sprachmodellen arbeiten – ihre Fähigkeit, falsche Ausgaben zu erkennen, mit der Größe des Modells steige…