模式识别与人工智能
首 页
期刊简介
编委会
投稿指南
伦理声明
联系我们
 
English
模式识别与人工智能
学术不端论文认定及处理办法
版权转让协议
保密证明
录用稿件电子版要求
修改说明格式
更多....
中国自动化学会
国家智能计算机研发中心
中科院合肥智能机械所
更多....
2022年 35卷 3期 刊出日期 2022-03-25
论文与报告
研究与应用
论文与报告
195
基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习
梁美玉, 王笑笑, 杜军平
跨媒体数据搜索中不同媒体类型的数据间存在特征异构和语义鸿沟问题,且社交网络数据往往呈现语义稀疏性、多样性等特性.针对上述问题,文中提出基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习模型,获取统一的跨媒体语义表示,应用于社交网络跨媒体搜索.首先,构建图像-单词关联图,并基于图随机游走策略挖掘图像和文本单词间直接语义关联和隐含语义关联,实现语义关系扩展.然后,构建基于跨媒体协同注意力机制的跨媒体细粒度特征学习网络,通过互相指导的跨媒体注意力机制协同学习图像和文本的细粒度语义关联.最后,构建跨媒体对抗哈希网络,联合跨媒体细粒度语义关联学习和对抗哈希学习,获取高效紧凑的跨媒体统一哈希语义表示.实验表明,文中模型在两个公开标准跨媒体数据集上均取得较优的跨媒体搜索性能.
2022 Vol. 35 (3): 195-206 [
摘要
] (
743
) [
HTML
1KB] [
PDF
732KB] (
542
)
207
基于多残差动态融合生成对抗网络的人脸素描-照片合成方法
孙锐, 孙琦景, 单晓全, 张旭东
针对现阶段人脸素描-照片合成方法合成的图像存在清晰度较低、面部细节模糊等问题,提出基于多残差动态融合生成对抗网络的人脸素描-照片合成方法.首先设计多残差动态融合网络,从不同的密集残差模块分别提取特征并进行残差学习.然后根据不同层次的多样化残差特征生成对应的偏移量,不同位置的卷积核依据偏移量改变采样坐标,使网络自适应地关注特征中重要信息.在避免特征信息逐级丢失和冗余信息干扰的前提下,网络有效整合几何细节信息与高级语义信息.方法同时引入多尺度感知损失,对不同分辨率的合成图像进行感知对比,使网络可由粗到细地对合成图像进行正则化约束.在香港中文大学面部素描数据集上的实验表明,文中方法合成的图像清晰度较高,面部细节完整,颜色一致,接近真实的人脸图像.
2022 Vol. 35 (3): 207-222 [
摘要
] (
685
) [
HTML
1KB] [
PDF
10709KB] (
456
)
223
基于程序性知识学习的项目状态转移函数与多分知识结构
孙晓燕, 李进金
在程序性知识的评估中,技能是指与项目的解决相关的操作路径.基于程序性知识的学习评价,文中提出由项目自身的状态结构诱导多分知识结构的方法,目的是建立适用于问题解答的多分评估体系.首先,根据各项目的解答或操作过程设定响应值,得到项目特定的响应值集.通过项目状态转移函数定义项目状态空间,将问题空间推广到多分情形.然后,由操作路径导出合取的技能映射,讨论由合取的技能映射诱导的多分知识结构.结果表明由技能映射通过合取模型诱导的多分知识结构满足逐项交封闭.最后,给出诱导多分知识结构的算法步骤,并举例说明算法的有效性.
2022 Vol. 35 (3): 223-242 [
摘要
] (
389
) [
HTML
1KB] [
PDF
818KB] (
496
)
243
结合自注意力特征过滤分类器和双分支GAN的面部表情识别
程艳, 蔡壮, 吴刚, 罗品, 邹海锋
现有面部表情识别方法提取表情特征时通常容易与其它面部属性混合,不利于面部表情的识别.对此,文中提出结合自注意力特征过滤分类器和双分支生成对抗网络的面部表情识别方法.首先,使用双分支生成对抗网络学习辨别性的表情表示,提出自注意力特征过滤分类器作为表情的分类模块.使用级联的LayerNorm和ReLU将低激活单元归零并保留高激活单元,生成多级特征.使用自注意力融合输出多级特征的预测结果,在一定程度上消除噪声对识别结果的影响.然后,提出基于滑动模块的双重图像一致性损失监督模型,学习具有辨别性的表情表示,使用滑动窗口计算重构损失,关注细节信息.最后,在CK+、RAF-DB、TFEID、BAUM-2i数据集上的实验表明文中方法识别效果较优.
2022 Vol. 35 (3): 243-253 [
摘要
] (
559
) [
HTML
1KB] [
PDF
1153KB] (
454
)
研究与应用
254
基于梯度的对抗排序攻击方法
吴晨, 张儒清, 郭嘉丰, 范意兴
互联网检索中普遍存在排名竞争这种对抗攻击行为,会产生许多不良影响,因此对攻击方法的研究有助于设计更鲁棒的排序模型.已有的攻击方法容易被人识别且无法有效攻击神经排序模型.因此,文中提出基于梯度的对抗排序攻击方法.方法分为3个模块:基于梯度大小的词重要度排序、基于梯度的排序攻击和基于词嵌入的同义词替换.针对给定的目标排序模型,首先基于构建的排序攻击目标进行梯度回传,利用梯度信息在指定文档上找到最重要的词.然后,基于投影梯度攻击原理,在词向量空间上对这些最重要的词进行扰动.最后,利用同义词替换技术将这些最重要的词替换为和原词语义相近且和扰动后的词向量最近邻的词,完成文档扰动.在MQ2007、MS MARCO数据集上的实验验证文中方法的有效性.
2022 Vol. 35 (3): 254-261 [
摘要
] (
473
) [
HTML
1KB] [
PDF
706KB] (
337
)
262
用于方面情感三元组抽取的词对关系学习方法
夏鸿斌, 李强, 肖奕飞
方面情感三元组抽取旨在识别一条评论中的方面项及其情感倾向,并提取与其相关的观点项.现有方法大多将该类任务分为多个子任务,将子任务组成流水线并完成这类任务.然而,基于流水线思想的方法在实际应用中会受到误差传播、不易使用等因素的影响.为此,文中提出词对关系学习方法,将方面情感三元组抽取任务转化为端到端的词对关系学习任务.方法包含一种可将句中的词对关系进行统一标注以表示所有三元组的词对关系标注的方法,以及为此特别构建的可输出词对关系的词对关系网络.首先,使用双向门控循环单元和混合式注意力对句子进行编码表示.然后,使用注意力图转换模块将句子编码转换为各项标签概率.最后,从词对关系标签结果中提取三元组.此外,将预训练的BERT(Bidirectional Encoder Representation from Transformer)应用于文中方法.在4个标准数据集上的实验表明,文中方法性能较优.
2022 Vol. 35 (3): 262-270 [
摘要
] (
494
) [
HTML
1KB] [
PDF
639KB] (
448
)
271
面向三维目标的矢量型卷积网络
邱起璐, 赵杰煜, 陈瑜
目前,三维目标识别方法大多基于卷积神经网络,在特征聚合过程中过多使用池化层,导致三维目标的空间信息丢失.针对上述问题,文中提出面向三维目标的矢量型卷积网络,用于完成三维目标的识别.首先,使用曲面多项式拟合网格目标的局部区域.然后,使用聚类算法得出曲面形状卷积核,通过卷积核和目标表面的相似度度量生成结构感知的特征向量,再利用多头自注意力机制模块实现局部区域到更大范围的特征聚集,得到部件层次特征向量.最后,使用三维矢量型网络实现目标分类.文中网络在SHREC10、SHREC11、SHREC15数据集上均取得较高的分类精度.此外,多分辨率目标对比实验和多采样点对比实验验证文中网络具有较强的泛化性和鲁棒性.
2022 Vol. 35 (3): 271-282 [
摘要
] (
404
) [
HTML
1KB] [
PDF
962KB] (
419
)
283
基于双监督网络嵌入的社区发现算法
郑文萍, 王英楠, 杨贵
针对基于网络嵌入的社区检测算法中节点嵌入和聚类过程独立进行时容易陷入局部极值的问题,文中提出基于双监督网络嵌入的社区发现算法.首先利用图自编码器,得到可保持网络的一阶相似性的节点嵌入.优化模块度,发现拓扑连接紧密的社区.采用自监督聚类优化,发现嵌入空间上相似的社区.引入互监督机制,使发现的社区在模块度优化和自监督聚类这两个角度上具有一致性,同时避免算法陷入局部极值.4个真实网络上的对比实验表明,DSNE性能较优.
2022 Vol. 35 (3): 283-290 [
摘要
] (
547
) [
HTML
1KB] [
PDF
1001KB] (
315
)
模式识别与人工智能
主管:中国科学技术协会
主办:中国自动化学会
国家智能计算机研究开发中心
中国科学院合肥智能机械研究所
出版:科学出版社
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由
北京玛格泰克科技发展有限公司
设计开发 技术支持:support@magtech.com.cn