KI News: Kurz und klar.

Anmelden

Group-Sensitive Offline Contextual Bandits

arXiv – cs.LG • 03.11.2025 05:00 • Original

#Offline Contextual Bandits #Fairness #Gruppenbasierte Belohnungsdisparität #Policy-Optimierung #Doppelt robuste Schätzung #Konvergenzgarantie #Grenzwertbeschränkung

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 04.02.2026 05:00

Simulation zeigt: Predictive Policing in Baltimore ist komplexer als gedacht

Towards Data Science • 01.02.2026 15:00

Verteiltes Reinforcement Learning: Skalierbare Hochleistungs-Optimierung

arXiv – cs.LG • 30.01.2026 05:00

FedGEM: Federiertes EM für unbekannte Clusterzahl – neue Methode überzeugt

arXiv – cs.LG • 29.01.2026 05:00

Neue Gleichung verbindet Genauigkeit und Fairness bei Algorithmen

arXiv – cs.AI • 27.01.2026 05:00

Success Conditioning: Erfolgsorientiertes Lernen löst Trust‑Region‑Optimierung

arXiv – cs.LG • 26.01.2026 05:00

Neuer Lernansatz: Sequenzielle Strafmethode für strenge Sample‑Beschränkungen