樊建,吴耿锋
模式识别与人工智能. 2006, 19(3): 428-432.
PDF全文 (
)
可视化
收藏
提出一种基于最先策略增强学习的ART2神经网络FPRLART2(ForemostPolicy Reinforcement Learning based ART2 neural network),并介绍其学习算法.为了达到在线学习的目的,在FPRLART2中,从状态到行为值之间的映射中,选择第一个得到奖励的行为,而不是选择诸如1step QLearning中具有最优行为值的行为.ART2神经网络用于存储分类模式,其权重通过增强学习增强或减弱,达到学习的目的.并将FPRLART2运用到移动机器人避碰撞问题的研究中.仿真实验表明,引入FPRLART2后减少移动机器人与障碍物发生碰撞的次数,具有良好的避碰效果.