Manifold-Dimensionenschätzung: Empirische Studie liefert praxisnahe Erkenntnisse
Die Manifold-Hypothese besagt, dass hochdimensionale Daten häufig auf oder in der Nähe einer niedrigdimensionalen Mannigfaltigkeit liegen. Um diese Struktur optimal zu nutzen, ist die Bestimmung ihrer Dimension entscheidend. Trotz zahlreicher Ansätze fehlt bislang eine systematische Bewertung der verfügbaren Schätzmethoden.
In der neuen Untersuchung wird ein umfassender Überblick über die theoretischen Grundlagen und acht repräsentative Dimensionenschätzer gegeben. Durch gezielte Experimente werden die Auswirkungen von Rauschen, Krümmung und Stichprobengröße auf die Genauigkeit der einzelnen Verfahren analysiert.
Die Autoren vergleichen die Schätzer anschließend auf einer breiten Palette synthetischer und realer Datensätze. Dabei wird ein methodischer Ansatz zur datenspezifischen Hyperparameter‑Optimierung vorgestellt, der die Leistung der Modelle weiter verbessert. Die Ergebnisse zeigen, dass in vielen Fällen einfachere Verfahren die besseren Ergebnisse liefern, was wertvolle Hinweise für Forscher und Praktiker gleichermaßen bietet.