模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2022, Vol. 35 Issue (6): 526-535    DOI: 10.16451/j.cnki.issn1003-6059.202206005
“基于深度学习的目标检测与识别”专题 最新目录| 下期目录| 过刊浏览| 高级检索 |
空间约束下自相互注意力的RGB-D显著目标检测
袁晓1, 肖云2, 江波1,3, 汤进1
1.安徽大学 计算机科学与技术学院 多模态认知计算安徽省重点实验室 合肥 230601;
2.安徽大学 人工智能学院 合肥 230601;
3.合肥综合性国家科学中心 人工智能研究院 合肥 230088
RGB-D Salient Object Detection Based on Spatial Constrained and Self-Mutual Attention
YUAN Xiao1, XIAO Yun2, JIANG Bo1,3, TANG Jin1
1. Anhui Provincial Key Laboratory of Multimodal Cognitive Computation, School of Computer Science and Technology, Anhui University, Hefei 230601;
2. School of Artificial Intelligence, Anhui University, Hefei 230601;
3. Institute of Artificial Intelligence, Hefei Comprehensive National Science Center, Hefei 230088

全文: PDF (1697 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对RGB-D显著目标检测问题,提出空间约束下自相互注意力的RGB-D显著目标检测方法.首先,引入空间约束自相互注意力模块,利用多模态特征的互补性,学习具有空间上下文感知的多模态特征表示,同时计算两种模态查询位置与周围区域的成对关系以集成自注意力和相互注意力,进而聚合两个模态的上下文特征.然后,为了获得更互补的信息,进一步将金字塔结构应用在一组空间约束自相互注意力模块中,适应不同空间约束下感受野不同的特征,学习到局部和全局的特征表示.最后,将多模态融合模块嵌入双分支编码-解码网络中,解决RGB-D显著目标检测问题.在4个公开数据集上的实验表明,文中方法在RGB-D显著目标检测任务上具有较强的竞争性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
袁晓
肖云
江波
汤进
关键词 RGB-D显著目标检测多模态融合自注意力机制卷积神经网络    
Abstract:Aiming at the problem of RGB-D salient object detection, a RGB-D salient object detection method is proposed based on pyramid spatial constrained self-mutual attention. Firstly, a spatial constrained self-mutual attention module is introduced to learn multi-modal feature representations with spatial context awareness by the complementarity of multi-modal features. Meanwhile, the pairwise relationships between the query positions and surrounding areas are calculated to integrate self-attention and mutual attention, and thus the contextual features of the two modalities are aggregated. Then, to obtain more complementary information, the pyramid structure is applied to a set of spatial constrained self-mutual attention modules to adapt to different features of the receptive field under different spatial constraints and learn local and global feature representations. Finally, the multi-modal fusion module is embedded into a two-branch encoder-decoder network model, and the RGB-D salient object detection task is solved. Experiments on four benchmark datasets show strong competitiveness of the proposed me-thod in RGB-D salient object detection.
Key wordsRGB-D Salient Object Detection    Multi-modal Fusion    Self-Attention Mechanism    Convolution Neural Network   
收稿日期: 2021-08-27     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.62076004,62006002)、安徽省自然科学基金青年项目(No.1908085QF264)、安徽高校协同创新项目(No.GXXT-2020-013)资助
通讯作者: 江 波,博士,副教授,主要研究方向为图像特征提取和匹配、图数据表示和学习.E-mail:jiangbo@ahu.edu.cn.   
作者简介: 袁 晓,硕士研究生,主要研究方向为显著性检测.E-mail:yuanx25@163.com.
肖 云,博士,副教授,主要研究方向为显著目标检测、多模态分析等.E-mail:xiaoyun@ahu.edu.cn.
汤 进,博士,教授,主要研究方向为图像视频的表示与识别、多模态分析等.E-mail:tangjin@ahu.edu.cn.
引用本文:   
袁晓, 肖云, 江波, 汤进. 空间约束下自相互注意力的RGB-D显著目标检测[J]. 模式识别与人工智能, 2022, 35(6): 526-535. YUAN Xiao, XIAO Yun, JIANG Bo, TANG Jin. RGB-D Salient Object Detection Based on Spatial Constrained and Self-Mutual Attention. Pattern Recognition and Artificial Intelligence, 2022, 35(6): 526-535.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202206005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2022/V35/I6/526
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn