稀疏奖励场景下基于状态空间探索的多智能体强化学习算法

方宝富^1,², 余婷婷^1,², 王浩^1,², 王在俊³

Multi-agent Reinforcement Learning Algorithm Based on State Space Exploration in Sparse Reward Scenarios

FANG Baofu^1,², YU Tingting^1,², WANG Hao^1,², WANG Zaijun³

两个场景中 λ 不同时的消融实验结果