模式识别与人工智能
2025年4月7日 星期一   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2006, Vol. 19 Issue (3): 428-432    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于最先策略增强学习的ART2神经网络*
樊建1,2,吴耿锋1
1.上海大学 计算机工程与科学学院 上海 200072
2.南京陆军指挥学院 南京 210045
ForemostPolicy Reinforcement Learning Based ART2 Neural Network
FAN Jian1,2, WU GengFeng1
1.School of Computer Engineering and Science, Shanghai University, Shanghai 200072
2.Nanjing Army Command College, Nanjing 210045

全文: PDF (591 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出一种基于最先策略增强学习的ART2神经网络FPRLART2(ForemostPolicy Reinforcement Learning based ART2 neural network),并介绍其学习算法.为了达到在线学习的目的,在FPRLART2中,从状态到行为值之间的映射中,选择第一个得到奖励的行为,而不是选择诸如1step QLearning中具有最优行为值的行为.ART2神经网络用于存储分类模式,其权重通过增强学习增强或减弱,达到学习的目的.并将FPRLART2运用到移动机器人避碰撞问题的研究中.仿真实验表明,引入FPRLART2后减少移动机器人与障碍物发生碰撞的次数,具有良好的避碰效果.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
樊建
吴耿锋
关键词 增强学习ART2神经网络最先策略避碰撞    
Abstract:A foremostpolicy reinforcement learning based ART2 neural network (FPRLART2) and its learning algorithm are proposed in this paper. To fit the requirement of real time learning, the first awarded behavior based on present states is selected in our ForemostPolicy Reinforcement Learning (FPRL) in stead of the optimal behavior in 1step QLearning. The algorithm of FPRL is given and it is integrated with ART2 neural network. The stored weights of classified pattern in ART2 is increased or decreased by reinforcement learning. The FPRLART2 is successfully used in collision avoidance of mobile robot and the simulation experiment indicates that the times of collision between robot and obstacle is effectively decreased. The FPRLART2 makes favorable result of collision avoidance.
Key wordsReinforcement Learning    ART2 Neural Network    ForemostPolicy    Collision Avoidance   
收稿日期: 2004-12-19     
ZTFLH: TP18  
基金资助:上海市科学技术发展基金项目(No.015115042)、上海市教委第4期重点学科建设项目(No.B682)资助
作者简介: 樊建,男,1978年生,博士研究生,主要研究方向为智能信息处理、机器人控制.E-mail: jfan@mail.shu.edu.cn.吴耿锋,男,1945年生,教授,博士生导师,主要研究方向为智能控制、神经元网络、模糊逻辑和专家系统.
引用本文:   
樊建,吴耿锋. 基于最先策略增强学习的ART2神经网络*[J]. 模式识别与人工智能, 2006, 19(3): 428-432. FAN Jian, WU GengFeng. ForemostPolicy Reinforcement Learning Based ART2 Neural Network. , 2006, 19(3): 428-432.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2006/V19/I3/428
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn