PSO reduziert Unsicherheit bei Online Feature‑Auswahl aus Streaming‑Daten
In vielen Anwendungen mit hochdimensionalen Streaming‑Daten wird die Online‑Feature‑Auswahl (OSFS) eingesetzt, doch häufig treten Datenlücken auf, die durch Sensorfehler oder technische Einschränkungen entstehen. Diese Unvollständigkeit erschwert die zuverlässige Auswahl relevanter Merkmale.
Der Ansatz OS2FS nutzt latente Faktor‑Analyse zur Imputation, kann aber bei unsicheren Feature‑Label‑Korrelationen noch schwächeln. Das neue Framework POS2FS kombiniert diese Imputation mit Particle‑Swarm‑Optimization (PSO), um die Unsicherheit in den Feature‑Label‑Beziehungen zu verringern. Zusätzlich wird die Theorie der Drei‑Wege‑Entscheidungen eingesetzt, um unscharfe Merkmale im überwachten Lernen zu handhaben.
In umfangreichen Tests an sechs realen Datensätzen zeigte POS2FS deutlich bessere Ergebnisse als herkömmliche OSFS‑ und OS2FS‑Methoden. Die höhere Genauigkeit resultiert aus einer robusteren Auswahl von Merkmalen, die die Modellleistung in unsicheren Streaming‑Umgebungen verbessert.