KI-Modelle komprimieren Gedanken: neue RL‑Methode senkt Tokenverbrauch
In der KI‑Forschung hat die Chain‑of‑Thought‑Technik (CoT) die Zuverlässigkeit von Sprachmodellen deutlich erhöht, indem sie die Modelle dazu bringt, ihre Überlegungen Schritt für Schritt zu formulieren. Dieser Ansatz h…