SWIFT-Transaktionen neu gruppiert: Hybrid-Ansatz steigert Genauigkeit
In der Welt der Banküberweisungen sind die Angaben zu Gegenparteien oft unstrukturiert und von manuellen Fehlern durchdrungen. Ein neues Verfahren kombiniert String‑Similarity, Topic‑Modelling, hierarchisches Clustering und regelbasierte Logik, um diese Daten effizient zu gruppieren. Dadurch erhalten Ermittler und Betrugspräventionsexperten ein leistungsfähiges Werkzeug, um Herkunfts- und Empfängerinformationen besser zu verstehen.
Der Ansatz nutzt keine reinen Sprachmodelle, die bei kurzen, nicht‑sprachlichen Einträgen versagen würden. Stattdessen werden die physischen und rechtlichen Details der Gegenparteien in einem hybriden Pipeline-Workflow verarbeitet, der auch unbekannte Clusterzahlen handhaben kann. Durch die Kombination von Ähnlichkeitsmaßen und thematischen Merkmalen entstehen robustere Gruppierungen als bei herkömmlichen Schlüsselwort‑Methoden.
Die Autoren haben die Methode an einem realen, beschrifteten Datensatz getestet und konnten die Leistung deutlich über dem Basis‑Rule‑Based-Ansatz nachweisen. Ergänzende Metriken wie Präzision und Recall wurden eingeführt, um die Qualität der Clusterbildung transparent zu bewerten. Das Ergebnis ist ein signifikanter Fortschritt in der Analyse von SWIFT‑Nachrichten, der die Nachverfolgung von Zahlungen und die Aufdeckung von Betrugsfällen erleichtert.