模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2022, Vol. 35 Issue (1): 1-16    DOI: 10.16451/j.cnki.issn1003-6059.202201001
综述与评论 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于模型的机器人强化学习研究综述
孙世光1, 兰旭光1, 张翰博1, 郑南宁1
1.西安交通大学 人工智能与机器人研究所 西安 710049
Model-Based Reinforcement Learning in Robotics: A Survey
SUN Shiguang1, LAN Xuguang1, ZHANG Hanbo1, ZHENG Nanning1
1. Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University, Xi'an 710049

全文: PDF (941 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

基于模型的强化学习通过学习一个环境模型和基于此模型的策略优化或规划,实现机器人更接近于人类的学习和交互方式.文中简述机器人学习问题的定义,介绍机器人学习中基于模型的强化学习方法,包括主流的模型学习及模型利用的方法.主流的模型学习方法具体介绍前向动力学模型、逆向动力学模型和隐式模型.模型利用的方法具体介绍基于模型的规划、基于模型的策略学习和隐式规划,并对其中存在的问题进行探讨.最后,结合现实中机器人学习任务面临的问题,介绍基于模型的强化学习在其中的应用,并展望未来的研究方向.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
孙世光
兰旭光
张翰博
郑南宁
关键词 人工智能机器人学习强化学习基于模型的强化学习    
Abstract

The model-based reinforcement learning makes robots closer to human-like learning and interaction by learning an environment model and optimizing policy or planning based on the model. In this paper, the definition of robot learning problems is described, and model-based reinforcement learning methods in robot learning are introduced, including mainstream model learning and model utilization methods. The mainstream model learning methods are given including the forward dynamics model, the inverse dynamics model and the implicit model. The model utilization methods are presented including model-based planning, model-based policy learning and implicit planning. The current problems on model-based reinforcement learning are discussed. Aiming at the problems of the robot learning task in reality, the application of model-based reinforcement learning is illustrated and the future research directions are analyzed.

Key wordsArtificial Intelligence    Robot Learning    Reinforcement Learning    Model-Based Reinforcement Learning   
收稿日期: 2022-01-08     
基金资助:

国家重点研发计划项目(No.2021ZD0112700)、国家自然科学基金面上项目(No.62125305,62088102,61973246)、教育部规划项目资助

通讯作者: 兰旭光,博士,教授,主要研究方向为计算机视觉、机器学习.E-mail:xglan@mail.xjtu.edu.cn.   
作者简介: 孙世光,博士研究生,主要研究方向为基于模型的强化学习、机器人控制.E-mail:sunshi.guang@163.com.
张瀚博,博士研究生,主要研究方向为深度强化学习、机器人控制.E-mail:zhanghanbo163@stu.xjtu.edu.cn.
郑南宁,博士,教授,主要研究方向为计算机视觉、模式识别.E-mail:nnzheng@mail.xjtu.edu.cn.
引用本文:   
孙世光, 兰旭光, 张翰博, 郑南宁. 基于模型的机器人强化学习研究综述[J]. 模式识别与人工智能, 2022, 35(1): 1-16. SUN Shiguang, LAN Xuguang, ZHANG Hanbo, ZHENG Nanning. Model-Based Reinforcement Learning in Robotics: A Survey. Pattern Recognition and Artificial Intelligence, 2022, 35(1): 1-16.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202201001      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2022/V35/I1/1
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn