Aligning Reasoning LLMs for Materials Discovery with Physics-aware Rejection Sampling
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
Neural Operators: Universelle Modelle durch Multiphysics‑Pretraining
arXiv – cs.LG
•
Stackelberg-Spiel optimiert Reward-Shaping für LLM-Alignment
arXiv – cs.LG
•
ContextEvolve: Multi-Agent-Ansatz optimiert Systemcode mit 33 % mehr Effizienz
arXiv – cs.LG
•
Verbesserte Post-Training-Quantisierung dank zukünftiger Aktivierungsdaten
arXiv – cs.LG
•
CodePilot: KI + Monte-Carlo-Suche zur automatischen Fehlerbehebung
arXiv – cs.LG
•
CARE‑RFT: Vertrauen & Rechenleistung vereint – neue Methode für LLM‑Reasoning