KI News: Kurz und klar.

Anmelden

Evaluating the Safety and Skill Reasoning of Large Reasoning Models Under Compute Constraints

arXiv – cs.AI • 24.09.2025 05:00 • Original

#Testzeit-Computing #Chain-of-Thought #Quantisierung #Policy-Optimierung #Reinforcement Learning #Sicherheit

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 04.02.2026 05:00

QuantLRM: Gewichtsanpassungen als Schlüssel zur Quantisierung von LLMs

arXiv – cs.AI • 02.02.2026 05:00

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

arXiv – cs.AI • 21.01.2026 05:00

UniMo: KI-gestützte Bewegungsgenerierung und -verständnis revolutioniert

arXiv – cs.LG • 21.01.2026 05:00

MICE: Reduziert Fehlverhalten in sicherheitskritischem Reinforcement Learning

arXiv – cs.LG • 21.01.2026 05:00

EVO: Extreme Value Policy Optimization senkt Sicherheitsverletzungen im RL

arXiv – cs.LG • 14.01.2026 05:00

Q-realign: Quantisierung nutzt Sicherheit – effiziente LLM-Deployment-Lösung