模式识别与人工智能
首 页
期刊简介
编委会
投稿指南
伦理声明
联系我们
 
English
模式识别与人工智能
学术不端论文认定及处理办法
版权转让协议
保密证明
录用稿件电子版要求
修改说明格式
更多....
中国自动化学会
国家智能计算机研发中心
中科院合肥智能机械所
更多....
2022年 35卷 7期 刊出日期 2022-07-25
“基于深度学习的图像处理”专题
“基于深度学习的图像处理”专题
575
基于传递注意力机制的非均匀雾图去雾算法
王科平, 段雨朦, 杨艺, 费树岷
针对非均匀雾霾图像难以建模、去雾时容易出现残留的问题,文中提出基于传递注意力机制的非均匀雾图去雾算法.针对雾霾分布的非均匀性,在网络中构建传递注意力机制,使注意力特征图中的权重信息在各个注意力块之间流动,有针对性地处理非均匀有雾图像中的雾霾噪声.为了减少普通深度卷积导致复原图像中细节信息丢失问题,构建稀疏结构平滑空洞卷积,用于提取图像特征,在保证较大感受野的同时保留更多的细节信息.最后,并联一个轻量级的残差块结构,用于补充重构图像的色彩、细节信息.实验表明,文中算法在非均匀有雾图像数据集和人工合成有雾图像数据集上均能取得较优效果,在主观效果和客观指标上都具有较大优势.
2022 Vol. 35 (7): 575-588 [
摘要
] (
784
) [
HTML
1KB] [
PDF
4232KB] (
544
)
589
基于Lmser-in-Lmser双向网络的人脸素描图像生成方法
盛庆杰, 苏锐丹, 涂仕奎, 徐雷
人脸素描图像生成问题目的是将人脸照片转换为对应的素描图像,已有方法生成的素描图像或缺乏素描纹理,或需要在额外的大规模数据集上进行预训练.针对上述问题,文中基于Lmser(Least Mean Square Error Reconstruction)构建内外嵌套的深度双向网络,即Lmser-in-Lmser双向网络,用于人脸素描图像的生成.利用Lmser的神经元对偶特性,即编码神经元和解码神经元之间形成双向短路连接,在内部Lmser子网络的编码器和解码器之间通过前向传递不同网络层进行学习,得到多层级特征,增强素描生成的纹理细节.同时建立具有同样结构的网络,反向建立素描映射到照片的模型.外部通过在2个Lmser子网络上施加一致性约束,实现反馈链接,改善素描特征.在基准数据集上的实验表明,文中方法性能较优,并且不需要在额外的数据集上进行预训练,可应用性较强.
2022 Vol. 35 (7): 589-601 [
摘要
] (
497
) [
HTML
1KB] [
PDF
4720KB] (
340
)
602
结合视觉显著性与注意力机制的低光照图像增强
尚晓可, 安南, 尚敬捷, 张韶岷, 丁鼐
低光照图像增强是解决低光照环境下各种视觉分析任务的基础和核心步骤,但现有主流方法由于普遍未能对结构信息进行有效刻画,往往存在曝光不均衡、颜色失真等问题.针对上述问题,文中提出结合视觉显著性与注意力机制的低光照图像增强方法.首先,构建基于注意力机制的低光照图像增强网络,在引入注意力机制的同时考虑局部细节和全局信息,正确刻画增强结果中的颜色信息.再遵循由粗到细的逐步优化理念,设计渐进式注意力机制,将增强过程分阶段细化,实现精细化建设.然后,引入显著性引导的特征融合,增强网络对图像中显著性目标的感知能力,从更符合视觉认知需求的角度提升对于结构信息的表达,有效避免产生噪声/伪影等问题.实验表明,文中方法有效解决现有工作存在的曝光不足与颜色失真等问题,性能较优.
2022 Vol. 35 (7): 602-613 [
摘要
] (
611
) [
HTML
1KB] [
PDF
4083KB] (
357
)
614
基于多尺度注意力机制的场景文本擦除
何平, 张恒, 刘成林
自然场景文本擦除技术可应用在图像通信中的隐私保护、图像编辑等领域,然而现阶段的场景文本擦除在面对背景复杂、文本尺度变化较大的场景图像时,难以提取鲁棒的文本特征,出现文本检测不全、背景修复不完整等问题.针对上述问题,文中提出基于多尺度注意力机制的场景文本擦除框架.该框架主要由背景修复网络和文本检测网络共同组成,它们共享一个主干网络.在背景修复网络中,设计纹理自适应模块,从原始特征的通道和空间两个维度进行特征编码,自适应地集成局部特征与全局特征,有效修复因重构文本区域而导致的阴影部分.在文本检测网络中,设计上下文感知模块,学习图像中文本区域和非文本区域之间的判别关系,有效区分文本区域和非文本区域,提升文本检测的效果.此外,为了增强网络的感受野,改进不同尺度文本的擦除效果,提出多尺度特征损失函数,同时优化背景修复网络和文本检测网络.SCUT-SYN、SCUT-EnsText数据集上的实验表明,文中框架可取得较优的文本擦除性能.
2022 Vol. 35 (7): 614-624 [
摘要
] (
711
) [
HTML
1KB] [
PDF
5454KB] (
323
)
625
基于区域互补注意力和多维注意力的轻量级图像超分辨率网络
周登文, 王婉君, 马钰, 高丹丹
轻量级卷积神经网络具有参数量较小、计算量较小、推理速度较快等特点,但性能受到极大限制.为了进一步提升轻量级图像超分辨率网络的性能,文中提出基于区域互补注意力和多维注意力的轻量级图像超分辨率网络.网络基本构件是双支路的多交互残差块,可有效融合多尺度特征.为了提高特征的利用率和表达能力,设计轻量且有效的区域互补注意力,使特征图不同区域的信息互相补充.同时设计多维注意力,分别在通道维和空间维建模像素间的依赖关系.实验表明文中网络性能较优,并将当前轻量级超分辨率网络的复杂度和性能平衡提升到一个较高水平.
2022 Vol. 35 (7): 625-636 [
摘要
] (
463
) [
HTML
1KB] [
PDF
2607KB] (
308
)
637
多视野特征表示的灰度图像彩色化方法
李洪安, 郑峭雪, 马天, 张婧, 李占利, 康宝生
图像彩色化是指预测灰度图像的颜色信息,虽然使用深度学习方法可自动地对灰度图像彩色化,但对图像中不同尺度目标的彩色化质量不高,尤其是在对复杂物体和小目标物体彩色化时,存在颜色溢出、误着色和图像颜色不一致的问题.针对上述问题,文中提出多视野特征表示的灰度图像彩色化方法.首先,设计多视野特征表示模块(Multi-field Feature Represented Block, MFRB),与改进的U-Net结合得到多视野特征表示U-Net.然后,将灰度图像输入U-Net中,并通过与判别器的对抗训练得到彩色图像.最后,利用VGG-19网络在不同尺度上计算图像的感知损失,提高图像彩色化结果的整体一致性.在不同类别的6个数据集上的实验表明,文中方法能有效提高彩色化图像质量,产生颜色更丰富、色调更一致的彩色图像,并在客观评价指标和主观感受上都较优.
2022 Vol. 35 (7): 637-648 [
摘要
] (
565
) [
HTML
1KB] [
PDF
3359KB] (
232
)
649
融合全局推理和MLP架构的甲状腺结节分割模型
李彬榕, 谢珺, 李钢, 续欣莹, 蓝子俊
针对甲状腺结节分割中存在的超声图像噪声干扰较大、结节尺寸多变和现有模型计算复杂度较高的问题,文中构建融合全局推理和多层感知机(Multi-layer Perception, MLP)架构的甲状腺结节分割模型.模型以轴向移位MLP模块为基础架构,以更小的计算复杂度实现不同空间位置特征之间的交互.在编码部分,融合端到端的全局推理单元,基于图卷积对图像全局信息进行交互,缓解图像噪声干扰较大的影响.在解码部分,引入金字塔特征层,完成多尺度特征交互,应对结节尺寸多变的问题.在DDIT数据集上的实验表明,文中模型性能较优,此外,文中模型还适用于乳腺结节分割、视网膜血管分割等其它医学图像分割任务.
2022 Vol. 35 (7): 649-660 [
摘要
] (
463
) [
HTML
1KB] [
PDF
1068KB] (
394
)
661
基于差异双分支编码器的多阶段图像融合方法
洪雨露, 吴小俊, 徐天阳
在现有的红外和可见光图像融合方法中,融合图像中的细节信息丢失严重,视觉效果不佳.针对上述问题,文中提出基于差异双分支编码器的多阶段图像融合方法.通过两支不同结构的编码器提取多模态图像的特征,增强特征的多样性.设计多阶段的融合策略,实现精细化图像融合.首先,在差异双分支编码器中,对两个编码分支提取的差异性特征进行初级融合.然后,在融合阶段,对多模态图像的显著性特征进行中级融合.最后,使用远程横向连接将差异双分支编码器的浅层特征传送给解码器,同时指导融合过程和图像重建.对比实验表明,文中算法可增强融合图像的细节信息,并在视觉效果和客观评价上都较优.
2022 Vol. 35 (7): 661-670 [
摘要
] (
450
) [
HTML
1KB] [
PDF
2952KB] (
274
)
模式识别与人工智能
主管:中国科学技术协会
主办:中国自动化学会
国家智能计算机研究开发中心
中国科学院合肥智能机械研究所
出版:科学出版社
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由
北京玛格泰克科技发展有限公司
设计开发 技术支持:support@magtech.com.cn