TangledFeatures: Starke Feature‑Auswahl in stark korrelierten Räumen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Feature‑Auswahl ist ein entscheidender Schritt bei der Entwicklung von Modellen, denn sie bestimmt sowohl die Vorhersagekraft als auch die Interpretierbarkeit. Viele gängige Verfahren konzentrieren sich jedoch ausschließlich auf die Genauigkeit und verlieren an Wirksamkeit, wenn die Eingangsvariablen stark korreliert sind. TangledFeatures löst dieses Problem, indem es ein neues Framework vorstellt, das aus Gruppen von verflochtenen Prädiktoren repräsentative Merkmale auswählt. Dadurch wird Redundanz reduziert, ohne die erklärende Kraft zu verlieren.

Die daraus resultierende Merkmalsmenge kann unmittelbar in nachgelagerten Modellen eingesetzt werden und bietet eine stabilere, leichter interpretierbare Basis als herkömmliche Auswahlmethoden. In einer Demonstration auf dem Alanin‑Dipeptid wurde TangledFeatures zur Vorhersage von Rückgrat‑Torsionswinkeln eingesetzt. Die ausgewählten Merkmale entsprechen dabei strukturell sinnvollen intraatomaren Entfernungen, die die Variation dieser Winkel erklären.

Ähnliche Artikel