模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2022, Vol. 35 Issue (8): 718-742    DOI: 10.16451/j.cnki.issn1003-6059.202208004
综述与评论 最新目录| 下期目录| 过刊浏览| 高级检索 |
问题设定驱动的深度强化学习研究:综述
张政锋1,2, 赵彬琦1,2, 单洪明3, 张军平1,2
1.复旦大学 上海智能信息处理重点实验室 上海 200438;
2.复旦大学 计算机科学技术学院 上海 200438;
3.复旦大学 类脑智能科学与技术研究院 上海 200433
A Survey of Problem Setting-Driven Deep Reinforcement Learning
ZHANG Zhengfeng1,2, ZHAO Binqi1,2, SHAN Hongming3, ZHANG Junping1,2
1. Shanghai Key Laboratory of Intelligent Information Processing, Fudan University, Shanghai 200438;
2. School of Computer Science, Fudan University, Shanghai 200438;
3. Institute of Science and Technology for Brain-Inspired Intelligence, Fudan University, Shanghai 200433

全文: PDF (1510 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 深度强化学习结合深度模型,广泛应用于智能控制、游戏竞技等领域.然而,现有强化学习的文献综述更多以某一难点为主深入梳理具体的方法技术,缺乏以问题本身为主的整体分析视角.现实问题总是混杂多个技术难点,而致力于解决单一难点的技术方法往往在具体问题场景上性能不及预期.因此,文中从智能体、任务、马尔可夫决策过程、策略类型、学习目标、交互模式这六大对象对问题设定进行定义,并以问题自身的设定为驱动,从整体上分析深度强化学习的研究现状、基础设定及其延伸设定.再梳理深度强化学习的发展脉络,分析关键技术和背后的主要动机.然后,以专家交互这类问题设定为例,提供一个以具体问题驱动的技术视角去整体看待该领域的发展趋势.最后介绍当前的研究热点并展望今后的研究方向.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张政锋
赵彬琦
单洪明
张军平
关键词 人工智能深度强化学习问题设定智能控制    
Abstract:Combined with deep models, deep reinforcement learning(RL) is widely applied in various fields such as intelligent control and game competition. However, the existing RL surveys mainly focus on some core difficulty and neglect the analysis of problem itself from an overall perspective. The practical application in real-world scenarios is confronted with many technical challenges , and the technical approaches for a particular problem are not as good as expected for specific scenarios. Therefore, problem setting is defined in this paper from six major aspects, including agent, task distribution, Markov decision process, policy class, learning objective and interaction mode. A problem setting-driven perspective is utilized to analyze overall research status, elementary and extended RL setting. Then, development direction, key technologies and main motivation of the current deep RL are further discussed. Moreover, expert interaction is taken as an example to further analyze the development trends of the field in general from the problem setting-driven perspective. Finally, hot topics and future directions for the field are proposed.
Key wordsArtificial Intelligence    Deep Reinforcement Learning    Problem Setting    Intelligent Control   
收稿日期: 2022-06-27     
ZTFLH: TP181  
基金资助:国家重点研究开发项目(No.2018YFB1305104)、国家自然科学基金项目(No.62176059)、教育部科技创新专项项目(No.000011)资助
通讯作者: 张军平,博士,教授,主要研究方向为机器学习、智能交通系统、生物认证、图像识别.E-mail:jpzhang@fudan.edu.cn.   
作者简介: 张政锋,硕士研究生,主要研究方向为机器学习、强化学习、游戏AI.E-mail:zfzhang19@fudan.edu.cn.
赵彬琦,硕士研究生,主要研究方向为机器学习、强化学习、游戏AI.E-mail:bqzhao20@fudan.edu.cn.
单洪明,博士,研究员,主要研究方向为机器学习、医学影像.E-mail:hmshan@fudan.edu.cn.
引用本文:   
张政锋, 赵彬琦, 单洪明, 张军平. 问题设定驱动的深度强化学习研究:综述[J]. 模式识别与人工智能, 2022, 35(8): 718-742. ZHANG Zhengfeng, ZHAO Binqi, SHAN Hongming, ZHANG Junping. A Survey of Problem Setting-Driven Deep Reinforcement Learning. Pattern Recognition and Artificial Intelligence, 2022, 35(8): 718-742.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202208004      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2022/V35/I8/718
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn