KI News: Kurz und klar.

Anmelden

Scaling Up, Speeding Up: A Benchmark of Speculative Decoding for Efficient LLM Test-Time Scaling

arXiv – cs.AI • 08.09.2025 05:00 • Original

#LLM #Test-Time Scaling #Speculative Decoding #Benchmark #Best-of-N Sampling #Multi-Round Thinking #N-Gram

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 06.02.2026 05:00

SDFP: Training‑freies Draft‑Modell für schnelle LLM‑Decodierung

arXiv – cs.AI • 04.02.2026 05:00

CoS: Dynamisches Routing für LLMs steigert Genauigkeit um 65 % bei bAbI

arXiv – cs.AI • 03.02.2026 05:00

Mehr aus Weniger lernen: REPCORE nutzt interne Zustände zur Benchmark-Kompression

arXiv – cs.AI • 03.02.2026 05:00

Neues Benchmark deckt Schwächen großer Sprachmodelle im Mathematik‑Denken auf

arXiv – cs.AI • 29.01.2026 05:00

AMA: Adaptive Memory durch Multi-Agenten-Kollaboration

arXiv – cs.LG • 27.01.2026 05:00

ThinkTank-ME: Mehrfach-Experten-Framework für Ereignisprognosen im Nahen Osten