Neuer Zwei-Stufen-Ansatz verbessert Long-Tail-Erkennung
In einer kürzlich veröffentlichten Arbeit auf arXiv wird ein innovativer Zwei-Stufen-Ansatz vorgestellt, der die Herausforderung der Long-Tail-Verteilung in Klassifikationsmodellen adressiert. Durch gezielte Maßnahmen soll die starke Verzerrung gegenüber häufigen Klassen reduziert und die Leistung bei seltenen Klassen gesteigert werden.
Der erste Lernschritt nutzt ein neues Repräsentationsverfahren, das aus Sicht der Informationstheorie entwickelt wurde. Dabei wird die intra-klassen Distanz minimiert, was zu einem klar getrennten Merkmalsraum führt und die Basis für eine ausgewogenere Klassifikation legt.
Im zweiten Schritt wird eine fortschrittliche Stichprobenstrategie eingeführt, die besonders informative Instanzen auswählt. Diese Methode korrigiert die von der Mehrheitsklasse dominierten Entscheidungsgrenzen, ohne die Gesamtleistung des Modells zu beeinträchtigen. Die Kombination aus beiden Stufen hat in umfangreichen Experimenten die bisher beste Leistung auf mehreren Long-Tail-Benchmarks erzielt.
Der zugehörige Code ist öffentlich zugänglich unter https://github.com/fudong03/BNS_IPDPP.