稀疏奖励场景下基于状态空间探索的多智能体强化学习算法

方宝富^1,², 余婷婷^1,², 王浩^1,², 王在俊³

Multi-agent Reinforcement Learning Algorithm Based on State Space Exploration in Sparse Reward Scenarios

FANG Baofu^1,², YU Tingting^1,², WANG Hao^1,², WANG Zaijun³

3s5z_vs_3s6z场景中各算法平均胜率对比