Forschung
RACER: Risikobewusste, kalibrierte Routenwahl für große Sprachmodelle
Die effiziente Weiterleitung von Anfragen an das optimale große Sprachmodell (LLM) ist entscheidend, um das Kosten‑Leistungsverhältnis in M…
arXiv – cs.LG