KI News: Kurz und klar.

Anmelden

Interaction as Intelligence Part II: Asynchronous Human-Agent Rollout for Long-Horizon Task Training

arXiv – cs.AI • 03.11.2025 05:00 • Original

#LLM agents #long-horizon tasks #Behavior Cloning #outcome-driven sampling #Apollo framework #asynchronous human guidance #action-level filtering #supervision control

Anzeige

Ähnliche Artikel

MarkTechPost • 04.02.2026 04:49

Offline-Training von sicherheitskritischen RL-Agenten mit Conservative Q‑Learning

arXiv – cs.AI • 09.01.2026 05:00

Behavior Cloning skaliert: Open Model verbessert kausales Denken Echtzeit-Gameplay

arXiv – cs.LG • 27.11.2025 05:00

Dataset‑Poisoning‑Angriffe auf Behavior‑Cloning: Neue Studie zeigt Schwachstellen

arXiv – cs.LG • 20.10.2025 05:00

Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning

arXiv – cs.AI • 13.10.2025 05:00

COMPASS: Enhancing Agent Long-Horizon Reasoning with Evolving Context

arXiv – cs.AI • 01.10.2025 05:00

ID-RAG: Identity Retrieval-Augmented Generation for Long-Horizon Persona Coherence in Generative Agents