Neues Dataset CASCADE und TESLA-Framework revolutionieren NetCVR-Vorhersagen
In industriellen Empfehlungssystemen wird die Conversion‑Rate (CVR) häufig zur Verkehrsverteilung genutzt, doch sie berücksichtigt nicht die Rückerstattungen. Um die wahre Kundenzufriedenheit und den Geschäftswert besser abzubilden, wurde die Net‑Conversion‑Rate (NetCVR) eingeführt – die Wahrscheinlichkeit, dass ein angeklicktes Produkt gekauft und nicht erstattet wird.
Die Vorhersage von NetCVR ist deutlich komplexer als die von CVR, weil sie zwei aufeinanderfolgende Verzögerungen umfasst: von Klick zu Kauf und von Kauf zu Rückerstattung. Diese beiden verzögerten Prozesse wirken sich gegensätzlich aus, sodass herkömmliche CVR‑Modelle nicht mehr anwendbar sind. Zusätzlich erschweren fehlende Open‑Source‑Datensätze und fehlende Online‑Trainingsschemata die Weiterentwicklung.
Zur Lösung dieser Probleme präsentiert die Forschung CASCADE, das erste groß angelegte Open‑Dataset aus der Taobao‑App, das speziell für die kontinuierliche Online‑Vorhersage von NetCVR entwickelt wurde. Eine eingehende Analyse liefert drei zentrale Erkenntnisse: Erstens zeigt NetCVR starke zeitliche Dynamik, was ein kontinuierliches Online‑Modellierung erfordert. Zweitens übertrifft ein gestuftes Modell, das CVR und Rückerstattungsrate separat behandelt, die direkte NetCVR‑Vorhersage. Drittens ist die Verzögerungszeit ein entscheidendes Merkmal, das sowohl CVR als auch Rückerstattungsrate beeinflusst.
Auf Basis dieser Einsichten wurde TESLA entwickelt – ein kontinuierliches NetCVR‑Modellierungsframework mit einer gestaffelten Architektur, stufenweiser Verzerrungsreduktion und einem verzögerungszeitbewussten Ranking‑Verlust. Umfangreiche Experimente zeigen, dass TESLA die Genauigkeit der NetCVR‑Vorhersage deutlich verbessert und damit die Effektivität von Empfehlungssystemen nachhaltig steigert.