模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2022年 35卷 10期 刊出日期 2022-10-25

深度学习在图像与视觉的应用
论文与报告
信息与动态
 
深度学习在图像与视觉的应用
863 基于多任务对抗和抗噪对抗学习的人脸超分辨率算法
陈泓佑, 陈帆, 和红杰, 蒋桐雨

高倍率单幅人脸图像超分辨率重建是一项具有实用价值但困难的任务.在人脸超分辨率任务中,端到端网络超分辨率图像较模糊,图像真实性和人眼视觉效果较差.针对上述问题,文中提出基于多任务对抗和抗噪对抗学习的人脸超分辨率算法.算法分为端到端网络学习阶段和网络参数微调阶段.为了提高端到端学习效果,设计深度多任务拉普拉斯金字塔网络,并结合多任务对抗学习.主任务为端到端学习,子任务为优化对抗学习惩罚项函数.为了改进通过对抗学习并微调主任务网络参数后的效果,在对抗学习的判别器优化过程中,融入抗噪对抗学习.实验表明,文中算法能使人脸超分辨率图像更具有图像真实性,更符合人眼视觉习惯.

2022 Vol. 35 (10): 863-880 [摘要] ( 1003 ) [HTML 1KB] [PDF 2122KB] ( 675 )
881 基于截断核范数的图像去噪展开网络
张琳, 叶海良, 杨冰, 曹飞龙
基于模型驱动的图像去噪通常需要先构造先验正则项,在求解优化模型时计算成本较高.基于数据驱动的方法得益于神经网络灵活的架构和强大的学习能力,具有较优越的性能和较高的效率,但往往缺乏足够的可解释性.为此,文中提出基于截断核范数的图像去噪展开网络,结合低秩矩阵恢复中基于截断核范数的模型驱动方法和图像去噪,并将每次迭代看作展开网络的一个阶段,把每个阶段进行连接,形成一个端到端的可训练展开网络.在上述每个阶段中,借助神经网络学习奇异值算子,解决奇异值分解在传统迭代算法中计算代价较高的问题.在多组去噪数据集上的实验验证文中网络的有效性.
2022 Vol. 35 (10): 881-892 [摘要] ( 590 ) [HTML 1KB] [PDF 2861KB] ( 371 )
893 面向夜间疲劳驾驶检测的改进Zero-DCE低光增强算法
黄振宇, 陈宇韬, 林定慈, 黄捷
为了提高夜间疲劳驾驶检测的准确率,在现有低光增强算法Zero-DCE(Zero-Reference Deep Curve Estimation)的基础上,提出改进Zero-DCE的低光增强算法.首先,引入上下采样结构,减少噪声影响.同时,引入注意力门控机制,提高网络对图像中人脸区域的敏感性,有效提高网络的检测率.然后,针对噪声相关问题,提出改进的核选择模块.进一步,使用MobileNet的深度可分离卷积替换Zero-DCE的标准卷积,提高网络的检测速度.最后,通过人脸关键点检测网络和分类网络,判断驾驶员的疲劳状态.实验表明,在夜间环境下,相比现有的疲劳驾驶检测算法,文中算法在人脸检测的准确率和眼睛状态的识别率上都有所提升,取得较令人满意的检测效果.
2022 Vol. 35 (10): 893-903 [摘要] ( 685 ) [HTML 1KB] [PDF 2666KB] ( 333 )
904 基于语义伪标签和双重特征存储库的无监督跨模态行人重识别
孙锐, 余益衡, 张磊, 张旭东
现有的有监督可见光-近红外行人重识别方法需要大量人力资源去除手工标注数据,容易受到标注数据场景的限制,难以满足真实多变应用场景的泛化性.因此,文中提出基于语义伪标签和双重特征存储库的无监督跨模态行人重识别方法.首先,提出基于对比学习框架的预训练方法,利用可见光行人图像和其生成的辅助灰度图像进行训练.利用该预训练方法获取对颜色变化具有鲁棒性的语义特征提取网络.然后,使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类方法生成语义伪标签.相比现有的伪标签生成方法,文中提出的语义伪标签在生成过程中充分利用跨模态数据之间的结构信息,减少跨模态数据颜色变化带来的模态差异.此外,文中还构建实例级困难样本特征存储库和中心级聚类特征存储库,充分利用困难样本特征和聚类特征,让模型对噪声伪标签具有更强的鲁棒性.在SYSU-MM01、RegDB两个跨模态数据集上的实验验证文中方法的有效性.
2022 Vol. 35 (10): 904-914 [摘要] ( 491 ) [HTML 1KB] [PDF 767KB] ( 415 )
915 基于多尺度特征融合的抗背景干扰人群计数网络
余鹰, 李剑飞, 钱进, 蔡震, 朱志亮
随着计算机视觉和人工智能相关技术的快速发展,基于智能视频分析的人群计数算法取得长足进步,但在计数准确性和算法鲁棒性上还有很大的提升空间.针对复杂场景人群计数任务中存在的目标多尺度及背景干扰等问题,文中提出基于多尺度特征融合的抗背景干扰人群计数网络(Anti-Background Interference Crowd Counting Network Based on Multi-scale Feature Fusion, AntiNet-MFF).在U-Net网络架构基础上融入多层次特征分割提取模块,借助深度学习强大的表征能力提取人群多尺度特征.同时,为了提升计数模型对人群区域的关注度,减少背景噪声干扰,在解码阶段生成背景分割注意力图,作为注意力引导计数模型聚焦人头区域,提升人群分布密度图的质量.在多个典型人群计数数据集上的实验表明,AntiNet-MFF在准确性和鲁棒性上都取得良好效果.
2022 Vol. 35 (10): 915-927 [摘要] ( 682 ) [HTML 1KB] [PDF 3309KB] ( 335 )
论文与报告
928 基于伪孪生网络双层优化的对比学习
陈庆宇, 季繁繁, 袁晓彤
目前,基于伪孪生网络的对比学习算法使用各种组件以获得最优学生网络,但忽略教师网络在下游任务中的表现,因此,文中提出基于伪孪生网络双层优化的对比学习,促进学生网络和教师网络相互学习,获得最优教师网络.双层优化策略包括基于近邻优化的学生网络优化策略和基于随机梯度下降的教师网络优化策略.基于近邻优化的学生网络优化策略让教师网络成为约束项,帮助学生网络更好地向教师网络学习.基于随机梯度下降的教师网络优化策略求解近似教师网络,梯度更新教师网络.在5个数据集上的实验表明,文中算法取得较高的k-NN(k=1)分类精度和线性分类精度,特别在批次大小较小时,优势较大.
2022 Vol. 35 (10): 928-938 [摘要] ( 569 ) [HTML 1KB] [PDF 2041KB] ( 384 )
939 基于属性树的并行化增量式动态属性约简算法
秦廷桢, 丁卫平, 鞠恒荣, 李铭, 黄嘉爽, 陈悦鹏, 王海鹏
传统增量算法主要侧重于从更新近似的角度进行属性约简,但在处理大规模数据集时需要评估所有属性并反复计算重要度,提升时间复杂度,降低效率.针对上述问题,文中提出基于属性树的并行化增量加速策略,关键步骤是将所有属性聚类成多棵属性树进行并行化动态属性评估.首先,根据属性树相关性度量选择合适的属性树进行属性评估,降低时间复杂度.再增加分支系数至停止准则中,随着分支深度的增加进行动态增加,可使算法在达到最大阈值后自主跳出循环,有效避免原先的冗余计算,提高效率.基于上述策略,提出基于属性树的增量属性约简算法,同时与Spark并行机制结合,设计基于属性树的并行化增量式动态属性约简算法.在多个数据集上的广泛实验表明,文中算法在保持分类性能的同时,可提高动态变化数据集约简的搜索效率,具有较好的性能优势.
2022 Vol. 35 (10): 939-951 [摘要] ( 397 ) [HTML 1KB] [PDF 1104KB] ( 280 )
信息与动态
952 [CAC2022]专题论坛前瞻
2022 Vol. 35 (10): 952-954 [摘要] ( 211 ) [HTML 1KB] [PDF 226KB] ( 225 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn