CoTJudger: Tool zur Messung von Effizienz und Redundanz in Sprachmodellen
Large Reasoning Models (LRMs) haben gezeigt, dass sie durch ausführliche Chain-of-Thought‑Spuren (CoT) vor dem endgültigen Antwortschreiben starke Leistungen erzielen. Dieses Vorgehen führt jedoch häufig zu „Over‑Reason…