模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2021年 34卷 3期 刊出日期 2021-03-25

“强化学习研究”专题
论文与报告
研究与应用
 
“强化学习研究”专题
191 基于深度强化学习的空间众包任务分配策略
倪志伟, 刘浩, 朱旭辉, 赵杨, 冉家敏
针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积收益为优化目标,基于马尔科夫决策过程从单个众包工作者的角度建模,将任务分配问题转化为对状态动作价值Q的求解及工作者与任务的一对一分配.然后采用改进的深度强化学习算法对历史任务数据进行离线学习,构建关于Q值的预测模型.最后,动态在线分配过程中实时预测Q值,作为KM(Kuhn-Munkres)算法的边权,实现全局累积收益的最优分配.在出租车真实出行数据集上的实验表明,当工作者数量在一定规模内时,文中策略可提高长期累积收益.
2021 Vol. 34 (3): 191-205 [摘要] ( 948 ) [HTML 1KB] [PDF 2559KB] ( 591 )
206 序列多智能体强化学习算法
史腾飞, 王莉, 黄子蓉
针对当前多智能体强化学习算法难以适应智能体规模动态变化的问题,文中提出序列多智能体强化学习算法(SMARL).将智能体的控制网络划分为动作网络和目标网络,以深度确定性策略梯度和序列到序列分别作为分割后的基础网络结构,分离算法结构与规模的相关性.同时,对算法输入输出进行特殊处理,分离算法策略与规模的相关性.SMARL中的智能体可较快适应新的环境,担任不同任务角色,实现快速学习.实验表明SMARL在适应性、性能和训练效率上均较优.
2021 Vol. 34 (3): 206-213 [摘要] ( 487 ) [HTML 1KB] [PDF 718KB] ( 513 )
214 基于强化学习的无标签网络剪枝
刘会东, 杜方, 余振华, 宋丽娟
为了消除深度神经网络中的冗余结构,找到具备较好性能和复杂度之间平衡性的网络结构,提出基于无标签的全局学习方法(LFGCL).LFGCL学习基于网络体系结构表示的全局剪枝策略,可有效避免以逐层方式修剪网络而导致的次优压缩率.在剪枝过程中不依赖数据标签,输出与基线网络相似的特征,优化网络体系结构.通过强化学习推断所有层的压缩率,采用深度确定性策略梯度算法探索最优网络结构.在多个数据集上的实验表明,LFGCL性能较优.
2021 Vol. 34 (3): 214-222 [摘要] ( 405 ) [HTML 1KB] [PDF 763KB] ( 347 )
223 稀疏奖励下基于情感的异构多智能体强化学习
方宝富, 马云婷, 王在俊, 王浩
在强化学习中,当处于奖励分布稀疏的环境时,由于无法获得有效经验,智能体收敛速度和效率都会大幅下降.针对此类稀疏奖励,文中提出基于情感的异构多智能体强化学习方法.首先,建立基于个性的智能体情感模型,为异构多智能体提供激励机制,作为外部奖励的有效补充.然后,基于上述激励机制,融合深度确定性策略,提出稀疏奖励下基于内在情感激励机制的深度确定性策略梯度强化学习算法,加快智能体的收敛速度.最后,在多机器人追捕仿真实验平台上,构建不同难度等级的稀疏奖励情景,验证文中方法在追捕成功率和收敛速度上的有效性和优越性.
2021 Vol. 34 (3): 223-231 [摘要] ( 499 ) [HTML 1KB] [PDF 1685KB] ( 407 )
论文与报告
232 基于多残差网络的结构保持超分辨重建
张铭津, 彭晓琪, 郭杰, 李云松, 王楠楠, 高新波
针对图像超分辨率重建中几何结构扭曲和细节缺失等问题,文中提出基于多残差网络的结构保持超分辨重建算法.在小波变换域和梯度域上进行深度学习.文中算法包含3种残差网络.残差梯度网络用于结构及边缘信息的重建.残差小波变换网络从整体上进行图像高频信息的重建.残差通道注意力网络通过调整网络注意力,着重学习重要的通道特征,从局部恢复图像高频信息,提高重建效率.实验表明,文中算法在定量结果和视觉效果方面均取得较优表现.
2021 Vol. 34 (3): 232-240 [摘要] ( 468 ) [HTML 1KB] [PDF 4174KB] ( 355 )
241 基于增强空谱特征网络的空间感知协同表示算法
刘双, 张永
高光谱图像具有高维度、带间相关性较高、样本数量较少等诸多问题,直接利用表示学习算法对高光谱图像进行分类会导致严重的维数灾难.对于高光谱图像,不是所有的光谱带都可用于特定的分类任务.因此,文中提出基于增强空谱特征网络的空间感知协同表示算法.依据高光谱图像内在的低维流形构建基于空谱特征的分层网络.利用训练的网络对高维数据进行特征提取,并利用空间感知协同表示算法进行分类.在两个高光谱数据集Indian Pines和Pavia University上的实验表明文中算法的有效性.
2021 Vol. 34 (3): 241-252 [摘要] ( 272 ) [HTML 1KB] [PDF 3244KB] ( 243 )
研究与应用
253 面向边缘反走样的屏幕内容索引图自适应预测
宋传鸣, 刘定坤, 孙诗琦, 刘丹
由于边缘反走样区域的相邻索引不具备等值关系,调色板编码的预测效率有限,因此文中提出基于边缘反走样决策和多方向模板的自适应预测编码方法.引进Pitteway面积加权的边缘反走样决策,设计8个4-邻域方向预测模板.利用2D线性相关模型建模待预测索引与4个参考像素之间的相关性.采用最小二乘法为每个方向模板计算一组预测权重系数,自适应地学习显示适配器的边缘反走样算法,实现索引图预测编码.实验表明,文中方法预测准确率较高,能够增强调色板编码在边缘反走样区域和复杂边缘区域的自适应预测能力.
2021 Vol. 34 (3): 253-266 [摘要] ( 286 ) [HTML 1KB] [PDF 1132KB] ( 186 )
267 融合事实文本的知识库问答方法
王广祥, 何世柱, 刘康, 余正涛, 高盛祥, 郭军军
在自然语言问题中,由于知识库中关系表达的多样化,通过表示学习匹配知识库问答的答案仍是一项艰巨任务.为了弥补上述不足,文中提出融合事实文本的知识库问答方法,将知识库中的实体、实体类型和关系转换为事实文本,并使用双向Transformer编码器(BERT)进行表示,利用BERT丰富的语义模式得到问题和答案在低维语义空间中的数值向量,通过数值计算匹配与问题语义最相近的答案.实验表明,文中方法在回答常见的简单问题时效果较优,鲁棒性较强.
2021 Vol. 34 (3): 267-274 [摘要] ( 316 ) [HTML 1KB] [PDF 855KB] ( 283 )
275 基于结构约束生成对抗网络的书法汉字生成
俞书世, 赵杰煜, 叶绪伦, 唐晨, 郑阳

目前书法汉字的生成研究在汉字生成过程中需要大量先验汉字组成信息,不仅对前期数据收集工作的要求较高,而且影响研究成果的扩展性.针对此问题,文中提出基于结构约束的条件堆叠生成对抗网络的书法汉字生成方法.将源汉字图像直接提取的汉字笔迹作为结构约束条件,通过条件堆叠生成对抗网络模型生成高质量的书法汉字.同时提出通过伪目标样本的半监督学习方法,用于解决书法汉字数据集较少的问题,也可生成训练不可见的书法汉字.实验表明,在使用少样本的特定风格的书法汉字数据集的前提下,文中方法可生成更高质量的书法汉字.

2021 Vol. 34 (3): 275-285 [摘要] ( 470 ) [HTML 1KB] [PDF 2108KB] ( 397 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn