Neuer Ansatz: Nichtlineare PCA mit Evolutionären Strategien
Ein neues Verfahren zur nichtlinearen Hauptkomponentenanalyse (PCA) nutzt Evolutionäre Strategien (ES), um die Grenzen der klassischen linearen PCA zu überwinden. Durch die Einbindung neuronaler Netzwerke werden die Datentransformationsfunktionen parametrisiert und anschließend mit ES optimiert, wodurch die nicht differenzierbare Eigenwertzerlegung umgangen wird.
Der Kern des Ansatzes ist eine granulierte Zielfunktion, die die individuelle Varianz jeder Variable maximiert. Im Gegensatz zur herkömmlichen globalen Varianzmaximierung liefert diese Methode ein stärkeres Lernsignal und führt zu einer besseren Erfassung komplexer Strukturen in den Daten. Gleichzeitig bleibt die Interpretierbarkeit erhalten, sodass Feature-Beiträge weiterhin mit Standardwerkzeugen wie Biplots visualisiert werden können.
Ein weiterer Vorteil besteht darin, dass kategoriale und ordinalen Variablen ohne die dimensionalen Explosionen eines One‑Hot‑Encodings verarbeitet werden können. In Tests mit synthetischen und realen Datensätzen übertrifft das neue Verfahren sowohl die lineare PCA als auch Kernel‑PCA in Bezug auf die erklärte Varianz, während es gleichzeitig die Vorteile der klassischen PCA beibehält.
Der komplette Code ist auf GitHub verfügbar, sodass Forscher und Praktiker das Verfahren leicht übernehmen und weiterentwickeln können.