Discovering New Theorems via LLMs with In-Context Proof Learning in Lean
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
Ax-Prover: A Deep Reasoning Agentic Framework for Theorem Proving in Mathematics and Quantum Physics
arXiv – cs.LG
•
Stackelberg-Spiel optimiert Reward-Shaping für LLM-Alignment
arXiv – cs.LG
•
ContextEvolve: Multi-Agent-Ansatz optimiert Systemcode mit 33 % mehr Effizienz
arXiv – cs.AI
•
Narrow Finetuning erhöht Risiko von emergentem Misalignment – Domänenabhängigkeit
arXiv – cs.AI
•
Ressourcenschonende Verstärkung für LLMs: One-Shot-Policy-Optimierung
arXiv – cs.AI
•
InfoReasoner: KI nutzt synthetische Belohnung zur besseren Informationssuche