模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2019年 32卷 4期 刊出日期 2019-04-25

论文与报告
研究与应用
 
论文与报告
289 基于时间相关度和覆盖权重的协同过滤推荐算法
张志鹏, 张尧, 任永功
基于物品的协同过滤(IBCF)在计算相似度和预测评分时为所有物品分配相同的权重,提供的推荐往往不能同时具有良好的预测精度和分类精度.因此,文中提出基于时间相关度和覆盖权重的协同过滤算法(TCWCF).将时间相关度函数应用于物品间的相似度计算,提高推荐的预测精度.同时构建覆盖度函数,融入预测评分阶段,提高推荐的分类精度.在MovieLens数据集上的实验表明,TCWCF性能优于IBCF和其它相关算法,可以同时为目标用户提供具有良好预测精度和分类精度的满意推荐
2019 Vol. 32 (4): 289-297 [摘要] ( 667 ) [HTML 1KB] [PDF 771KB] ( 378 )
298 李群流形上的在线视频稳像算法
杨佳丽, 来林静, 张磊, 黄华
针对传统视频稳像算法无法兼顾高质量稳像和低延时的问题,提出李群流形上卡尔曼滤波的实时视频稳像算法.将视频帧间运动分解为旋转分量和平移分量.旋转分量由陀螺仪数据计算的旋转矩阵表示,平移分量由视频帧间匹配得到的平移矩阵表示,旋转矩阵的序列和平移矩阵的序列分别对应于李群流形上的运动路径.利用李群流形上的卡尔曼滤波分别对旋转分量和平移分量进行平滑.最终通过运动补偿获得稳定的视频帧序列.实验表明,文中算法能够兼顾延时和稳像效果,可以在移动端实现高质量的在线视频稳像.
2019 Vol. 32 (4): 298-305 [摘要] ( 578 ) [HTML 1KB] [PDF 1127KB] ( 375 )
306 基于多目标优化策略的在线学习资源推荐方法
李浩君, 杨琳, 张鹏威
目前在线学习资源推荐较多采用单目标转化方法,推荐过程中对学习者偏好考虑相对不足,影响学习资源推荐精度.针对上述问题,文中提出基于多目标优化策略的在线学习资源推荐模型(MOSRAM),在学习者规划时间内,以同时获得学习者对学习资源类型偏好度最大和难度水平适应度最佳为优化目标,设计具有向邻居均值学习能力和探索新区域能力的多目标粒子群优化算法(NEMOPSO),提出以MOSRAM为核心的在线学习资源推荐方法(NEMOPSO-RA).不同问题规模下融合经典多目标优化算法的推荐方法对比实验表明,NEMOPSO-RA可以有效提高在线学习资源的推荐精度和推荐性能.
2019 Vol. 32 (4): 306-316 [摘要] ( 508 ) [HTML 1KB] [PDF 946KB] ( 404 )
317 基于图卷积网络和自编码器的半监督网络表示学习模型
王杰, 张曦煌
为了保留网络结构信息和节点特征信息,结合图卷积神经网络(GCN)和自编码器(AE),提出可扩展的半监督深度网络表示学习模型(Semi-GCNAE).利用GCN捕获节点的K阶邻域中所有节点的结构和特征信息,并将捕获的信息作为AE的输入.AE对GCN捕获的K阶邻域信息进行特征提取和非线性降维,并结合Laplacian特征映射保留节点的团簇结构信息.引入集成学习方法联合训练GCN和AE,使模型习得的节点低维向量表示能同时保留网络结构信息和节点特征信息.在5个真实数据集上的广泛评估表明,文中模型习得的节点低维向量表示可以有效保留网络的结构和节点特征信息,并在节点分类、可视化和网络重构任务上性能较优.
2019 Vol. 32 (4): 317-325 [摘要] ( 667 ) [HTML 1KB] [PDF 4742KB] ( 628 )
326 基于维度扩展和重排的类圆映射可视化聚类方法
黄珊, 黎明, 陈昊, 李军华, 张聪炫
现有的径向布局可视化方法无法有效捕获高维数据的非线性结构.因此,文中提出基于维度扩展和重排的类圆映射可视化聚类方法.利用近邻传播聚类算法和多目标聚类可视化评价指标对高维数据进行维度扩展,然后对扩展后的高维数据进行维度相关性重排,最后利用类圆映射机制降维至二维可视化空间,实现高维数据有效可视化聚类.实验表明,文中提出的维度扩展和重排策略能有效提高类圆映射可视化方法聚类效果,其中的维度扩展策略也能显著提高其它径向布局可视化方法聚类效果,泛化性能较好.此外,相比同类方法,文中方法在可视化聚类准确度、拓扑保持、Dunn指数及效果上优势明显
2019 Vol. 32 (4): 326-335 [摘要] ( 392 ) [HTML 1KB] [PDF 3455KB] ( 298 )
336 基于稀疏化双线性卷积神经网络的细粒度图像分类
马力, 王永雄
针对双线性卷积神经网络(B-CNN)在细粒度图像分类中因参数过多、复杂度过高而导致的过拟合问题,提出稀疏化B-CNN.首先对B-CNN的每个特征通道引入比例因子,在训练中采用正则化方法对其稀疏.然后利用比例因子的大小判别特征通道的重要性.最后将不重要特征通道按一定比例裁剪,消除网络过拟合,提高关键特征的显著性.稀疏化B-CNN属于弱监督学习,可实现端到端训练.在FGVC-aircraft、Stanford dogs、Stanford cars这3个细粒度图像数据集上的实验表明,稀疏化B-CNN的准确率高于B-CNN,也优于或基本接近其它通用的细粒度图像分类算法.
2019 Vol. 32 (4): 336-344 [摘要] ( 515 ) [HTML 1KB] [PDF 766KB] ( 725 )
研究与应用
345 基于强化学习的数据驱动最优镇定控制及仿真
陆超伦, 李永强, 冯远静
利用Q-学习算法,针对模型未知只有数据可用的非线性被控对象,解决最优镇定控制问题.由于状态空间和控制空间的连续性,Q-学习只能以近似的方式实现.因此,文中提出的近似Q-学习算法只能获得一个次优控制器.尽管求得的控制器只是次优,但是仿真研究表明,对于强非线性被控对象,相比线性二次型调节器和深度确定性梯度下降方法,文中方法的闭环吸引域更宽广,实际指标函数也更小.
2019 Vol. 32 (4): 345-352 [摘要] ( 659 ) [HTML 1KB] [PDF 1204KB] ( 739 )
353 基于深度学习的芯片图像超分辨率重建
范明明, 池源, 张铭津, 李云松

考虑到卷积神经网络可以通过训练过程引入图像的先验知识,文中提出基于深度学习的芯片图像超分辨率重建.利用卷积神经网络改善迭代反投影法的初始估计图像,通过迭代过程引入图像序列间的互补信息,建立芯片图像的样本集.实验表明,在不同放大倍数下,改进算法的客观评价指标平均值均较高,在芯片图像中的电路密集处,改进算法的主观视觉感受也较好.同时,文中算法适用于自然图像.

2019 Vol. 32 (4): 353-360 [摘要] ( 611 ) [HTML 1KB] [PDF 1516KB] ( 596 )
361 融合深度学习和语义树的草图识别方法
赵鹏, 冯晨成, 韩莉, 纪霞
现有的草图识别框架利用整幅图像作为网络输入,草图识别过程可解释性较差.文中融合深度学习和语义树,提出草图语义网(Sketch-Semantic Net).首先对草图进行部件分割,将单幅完整的草图分割为多个具有语义概念的部件图.然后利用深度迁移学习识别草图部件.最后通过语义树的语义概念关联部件同部件所属草图对象类别,较好地弥补sketch图像从底层语义到高层语义之间的语义鸿沟.在广泛应用的草图分割数据集上的实验验证文中方法的有效性.
2019 Vol. 32 (4): 361-368 [摘要] ( 514 ) [HTML 1KB] [PDF 858KB] ( 361 )
369 基于字符级截断式循环神经网络的人名国籍识别
张钰莎, 张礼明, 蒋盛益
人名是反映用户国籍的关键信息,不同国籍的人名在结构和组成成分方面存在差异性和关联性.目前,基于人名的国籍识别研究工作大部分将人名切分成多个独立的字符单元,忽略字符间微妙的搭配和序列关系.针对上述问题,文中提出基于字符级截断式循环神经网络的人名国籍识别模型,将人名通过滑动窗口的方式截断成多个子序列,利用长短期记忆单元模型学习不同子序列内部的字符组合关系,通过平均池化操作聚合所有子序列信息,获取最终的人名向量表示.最后根据该人名向量实现用户的国籍识别.截断式的子序列有利于模型更关注人名内部的细微差异.在Olympic运动员和Aminer学者数据集上的实验表明,文中模型性能较优.
2019 Vol. 32 (4): 369-375 [摘要] ( 510 ) [HTML 1KB] [PDF 697KB] ( 378 )
376 基于多视图半监督学习的人体行为识别
唐超, 王文剑, 王晓峰, 张琛, 邹乐
由于人的行为在本质上的复杂性,单一行为特征视图缺乏全面分析人类行为的能力.文中提出基于多视图半监督学习的人体行为识别方法.首先,提出3种不同模态视图数据,用于表征人体动作,即基于RGB模态数据的傅立叶描述子特征视图、基于深度模态数据的时空兴趣点特征视图和基于关节模态数据的关节点投影分布特征视图.然后,使用多视图半监督学习框架建模,充分利用不同视图提供的互补信息,确保基于少量标记和大量未标记数据半监督学习取得更好的分类精度.最后,利用分类器级融合技术并结合3种视图的预测能力,同时有效解决未标记样本置信度评估问题.在公开的人体行为识别数据集上实验表明,采用多个动作特征视图融合的特征表示方法的判别力优于单个动作特征视图,取得有效的人体行为识别性能.
2019 Vol. 32 (4): 376-384 [摘要] ( 757 ) [HTML 1KB] [PDF 806KB] ( 485 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn