Neues Verfahren: Cone Collapse verbessert nichtnegative Matrixfaktorisierung
Die nichtnegative Matrixfaktorisierung (NMF) bleibt ein zentrales Werkzeug, um aus großen Datensätzen kompakte, partsbasierte Darstellungen zu extrahieren. Besonders in der Clusteranalyse wird NMF oft mit orthogonalen Varianten kombiniert, damit die Zeilen der Repräsentationsmatrix als weiche Clusterindikatoren fungieren. Bisher wurden die Algorithmen jedoch überwiegend aus einer Optimierungsperspektive entwickelt und nutzten die zugrunde liegende konische Geometrie nicht vollständig aus.
In einer neuen Studie wird NMF aus geometrischer Sicht neu beleuchtet. Die Autoren stellen den „Cone Collapse“-Algorithmus vor, der mit dem gesamten nichtnegativen Orthanten beginnt und diesen schrittweise auf den minimalen Konus reduziert, der durch die Datenpunkte erzeugt wird. Unter milden Annahmen über die Daten konvergiert der Prozess in endlich vielen Schritten und rekonstruiert exakt die minimalen Erzeuger des Konus.
Auf dieser Grundlage wird ein konus‑bewusstes orthogonales NMF-Modell (CC‑NMF) entwickelt, das die erkannten Extremstrahlen als Basis nutzt. In umfangreichen Tests auf 16 Datensätzen aus Genexpression, Text und Bildanalyse zeigt CC‑NMF eine konsistente Verbesserung der Cluster‑Reinheit gegenüber etablierten Baselines wie multiplikativen Updates, ANLS, projective NMF, ONMF und sparse NMF. Die Ergebnisse unterstreichen, dass die explizite Rekonstruktion des Datenkonus sowohl theoretisch fundiert als auch praktisch leistungsfähig ist.