Neuer Ansatz: Gumbel- und Sequential-Halving-Tree-Search steigert LLM-Logik
Neuer Forschungsbericht zeigt, dass die bisherige AlphaZero‑inspirierte Baum‑Suche bei großen Sprachmodellen nicht mehr mit steigenden Suchbudgets skaliert. Auf den Prüfplätzen GSM8K und Game24 sinkt die Genauigkeit, je…