模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2007, Vol. 20 Issue (2): 236-240    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于探索密度的Option子目标发现算法
孟江华,朱纪洪,孙增圻
清华大学 计算机科学与技术系 智能技术与系统国家重点实验室 北京 100084
Discovery Algorithm for Option Based on Exploration Density
MENG JiangHua, ZHU JiHong, SUN ZengQi
The State Key Laboratory of Intelligent Technology and System, Department of Computer Science and Technology, Tsinghua University, Beijing 100084

全文: PDF (666 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出状态探索密度的概念,通过检测状态对智能体探索环境能力的影响来发现学习的子目标并构建对应的Option.用该算法创建Option的再励学习算法能有效提高学习速度.算法具有和任务无关、不需要先验知识等优点,构造出的Option在同一环境下不同任务间可以直接共享.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
孟江华
朱纪洪
孙增圻
关键词 递阶再励学习Option探索密度(ED)    
Abstract:A new method, named exploration density(ED) inspection, is presented. Useful options were discovered by the method through inspecting the influence of the state on agent’s explore ability in state space. The simulation results show that the proposed algorithm has better performance in reinforcement learning. The method has characteristics of taskindependence, no need of prior knowledge, etc. The created options can be directly shared among different tasks in the same environment.
Key wordsHierarchical Reinforcement Learning    Option    Exploration Density (ED)   
收稿日期: 2006-03-14     
ZTFLH: TP181  
作者简介: 孟江华,男,1976年生,博士研究生,主要研究方向为机器学习、移动机器人导航.Email:meng_jianghua@263.net.朱纪洪,男,1969年生,教授,主要研究方向为无人飞行器技术.孙增圻,男,1943年生,教授,博士生导师,主要研究方向为机器人智能控制.
引用本文:   
孟江华,朱纪洪,孙增圻. 基于探索密度的Option子目标发现算法[J]. 模式识别与人工智能, 2007, 20(2): 236-240. MENG JiangHua, ZHU JiHong, SUN ZengQi. Discovery Algorithm for Option Based on Exploration Density. , 2007, 20(2): 236-240.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2007/V20/I2/236
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn