KI News: Kurz und klar.

Anmelden

Adaptive Divergence Regularized Policy Optimization for Fine-tuning Generative Models

arXiv – cs.LG • 22.10.2025 05:00 • Original

#Reinforcement Learning #Generative Models #Adaptive Divergence Regularization #Wasserstein-2 #Flow Matching #text-to-image generation #Semantic Alignment #diversity

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 17.11.2025 05:00

ARCTraj: Datensatz mit menschlichen Denkpfaden für abstraktes Problemlösen

arXiv – cs.LG • 04.02.2026 05:00

GraphDancer: LLMs lernen, Graphen zu erkunden und zu durchdenken

arXiv – cs.LG • 04.02.2026 05:00

RL für Mensch‑Roboter‑Kollaboration: Off‑Policy Evaluation ohne Live‑Interaktion

Hugging Face – Blog • 03.02.2026 11:25

Training Design for Text-to-Image Models: Lessons from Ablations

arXiv – cs.AI • 03.02.2026 05:00

KEPO: Wissensbasierte Präferenzoptimierung für Reinforcement Learning

arXiv – cs.AI • 03.02.2026 05:00

LLMs im Pokerspiel: Noch weit von Profis entfernt – ToolPoker setzt neue Maßstäbe