RankRefine: Mit paarweisen Ranglisten die Regressionsgenauigkeit verbessern
Die präzise Vorhersage kontinuierlicher Eigenschaften ist für viele wissenschaftliche und ingenieurtechnische Aufgaben von entscheidender Bedeutung. Während tiefe Lernregressoren bei reichlich vorhandenen Labels hervorragende Ergebnisse liefern, verschlechtert sich ihre Genauigkeit in datenarmen Szenarien deutlich.
RankRefine ist ein modellunabhängiges, plug‑and‑play Verfahren, das die Ausgangswerte eines beliebigen Regressors mit einer rangbasierten Schätzung kombiniert. Durch inverse Varianzgewichtung werden die beiden Quellen zusammengeführt, ohne dass ein erneutes Training erforderlich ist. Das Verfahren nutzt lediglich paarweise Ranglisten, die von Experten oder generellen Sprachmodellen bereitgestellt werden.
In einer Aufgabe zur Vorhersage molekularer Eigenschaften konnte RankRefine die mittlere absolute Fehlerquote um bis zu 10 % reduzieren – und das mit nur 20 paarweisen Vergleichen, die von einem großen Sprachmodell ohne Feintuning generiert wurden.
Da Ranglisten von Menschen oder generellen LLMs ausreichen, um Regressionsmodelle in verschiedensten Bereichen zu verbessern, bietet RankRefine eine praktische und breit einsetzbare Lösung, insbesondere in Situationen mit begrenzten Daten.