DeepAtlas: neues Tool zur effektiven Manifold‑Lernung
Wissenschaftler haben ein neues Verfahren namens DeepAtlas vorgestellt, das die Annahme des „Manifold‑Hypothese“ auf die Probe stellt und gleichzeitig die Daten in niedrigdimensionale Räume überführt. Die Hypothese besagt, dass hochdimensionale Datensätze aus niedrigdimensionalen Mannigfaltigkeiten stammen. Bisherige Methoden erzeugen globale Einbettungen, während DeepAtlas lokale Nachbarschaften nutzt, um die Struktur genauer zu erfassen.
DeepAtlas erstellt zunächst lokale Einbettungen der Daten und trainiert anschließend tiefe neuronale Netze, die zwischen diesen lokalen Darstellungen und den Originaldaten übersetzen. Durch die Messung topologischer Verzerrungen kann das Tool bestimmen, ob ein Datensatz tatsächlich aus einer Mannigfaltigkeit stammt und, falls ja, welche Dimension diese hat. Diese Fähigkeit macht DeepAtlas zu einem leistungsstarken Werkzeug, um die Gültigkeit der Manifold‑Hypothese empirisch zu prüfen.
Tests mit synthetischen Datensätzen zeigen, dass DeepAtlas die zugrunde liegenden Mannigfaltigkeitsstrukturen zuverlässig erlernen kann. Interessanterweise erfüllen viele reale Datensätze – darunter auch Single‑Cell‑RNA‑Sequenzierungen – die Hypothese nicht. In den Fällen, in denen die Hypothese zutrifft, liefert DeepAtlas ein generatives Modell, das die Anwendung von Techniken aus der differenziellen Geometrie auf verschiedenste Datensätze ermöglicht.