CARL: Critical Action Focused Reinforcement Learning for Multi-Step Agent

#1 CARL: Critical Action Focused Reinforcement Learning for Multi-Step Agent [PDF¹] [Copy] [Kimi] [REL]

Authors: Leyang Shen, Yang Zhang, Chun Kai Ling, Xiaoyan Zhao, Tat-Seng Chua

Agents capable of accomplishing complex tasks through multiple interactions with the environment have emerged as a popular research direction. However, in such multi-step settings, the conventional group-level policy optimization algorithm becomes suboptimal because of its underlying assumption that each action holds equal contribution, which deviates significantly from reality. Our analysis reveals that only a small fraction of actions are critical in determining the final outcome. Building on this insight, we propose CARL, a critical-action-focused reinforcement learning algorithm tailored for multi-step agents. CARL achieves focused training through providing action-level optimization signals for high-criticality actions while excluding low-criticality actions from model update. Extensive experiments demonstrate that CARL achieves both stronger performance and higher efficiency during training and inference across diverse evaluation settings.

Subjects: Machine Learning , Artificial Intelligence , Computation and Language

Publish: 2025-12-04 16:15:46 UTC

2512.04949

#1 CARL: Critical Action Focused Reinforcement Learning for Multi-Step Agent [PDF1] [Copy] [Kimi] [REL]

#1 CARL: Critical Action Focused Reinforcement Learning for Multi-Step Agent [PDF¹] [Copy] [Kimi] [REL]