RACER: Risikobewusste, kalibrierte Routenwahl für große Sprachmodelle
Die effiziente Weiterleitung von Anfragen an das optimale große Sprachmodell (LLM) ist entscheidend, um das Kosten‑Leistungsverhältnis in Multi‑Model‑Systemen zu optimieren. Traditionelle Router wählen jedoch meist ein…