Forschung
Re^2: LLMs optimieren Denken durch erneutes Starten
Eine neue Methode namens Re^2 (Reinforcement Learning with Re-solving) verspricht, die Rechenleistung großer Sprachmodelle (LLMs) gezielt f…
arXiv – cs.AI