Neues Modell erkennt Transportrisiken aus sozialen Medien

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Städtische Verkehrsbetriebe nutzen vermehrt soziale Medien, um Risiken wie Überfüllung, Verspätungen oder Sicherheitsvorfälle frühzeitig zu erkennen. Die Herausforderung besteht darin, dass die relevanten Signale selten, kurz und von alltäglichem Chat übertönt werden. Ein neues Verfahren löst dieses Problem, indem es sprachliche Interaktionen und die Einflusskraft der Nutzer gemeinsam modelliert.

Im ersten Schritt wird aus bereinigten Beiträgen ein Einflussgewicht‑basierter Schlüsselwort‑Kohärenzgraph erstellt, bei dem Beiträge mit hoher sozialer Wirkung proportionale Bedeutung erhalten. Das Herzstück des Ansatzes ist die Poisson‑Deconvolution‑Factorisierung (PDF), die diesen Graphen in eine kompakte thematische Struktur und themenspezifische Residuen zerlegt. Dadurch entstehen leicht interpretierbare Themen‑Schlüsselwort‑Basen sowie Gewichtungen, die die Wichtigkeit jedes Themas widerspiegeln.

Ein Dekorrelationsregularisierer sorgt dafür, dass die Themen klar voneinander abgegrenzt sind, während ein schlankes Optimierungsverfahren stabile Konvergenz unter Nichtnegativitäts‑ und Normalisierungseinschränkungen gewährleistet. Die optimale Themenanzahl wird durch einen auf Kohärenz basierenden Sweep bestimmt, der die Qualität und Unterscheidbarkeit der erlernten Themen bewertet.

In umfangreichen Social‑Media‑Streams erzielt das Modell eine führende Kohärenz und starke Themenvielfalt im Vergleich zu etablierten Baselines. Der Code sowie die zugehörigen Datensätze sind öffentlich zugänglich unter GitHub.

Ähnliche Artikel