模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2023, Vol. 36 Issue (8): 701-711    DOI: 10.16451/j.cnki.issn1003-6059.202308003
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
双分支多粒度局部对齐的实例级草图图像检索
韩雪昆1,2, 苗夺谦1,2, 张红云1,2, 张齐贤1,2
1.同济大学 电子信息与工程学院 上海 201804;
2.同济大学 嵌入式系统与服务计算教育部重点实验室 上海 201804
Instance-Level Sketch-Based Image Retrieval Based on Two Stream Multi-granularity Local Alignment Network
HAN Xuekun1,2, MIAO Duoqian1,2, ZHANG Hongyun1,2, ZHANG Qixian1,2
1. College of Electronic and Information Engineering, Tongji University, Shanghai 201804;
2. Key Laboratory of Embedded System and Service Computing, Ministry of Education, Tongji University, Shanghai 201804

全文: PDF (1625 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 实例级草图图像检索旨在使用草图检索图像.草图与真实图像之间存在模态差异大和特征不对齐问题,现有方法不能有效减小草图和图像之间模态差异,并且只在单个粒度上获取信息,无法有效进行特征对齐.因此,文中提出双分支多粒度局部对齐网络(Two Stream Multi-granularity Local Alignment Network, TSMLA),引入双分支特征提取器,提取模态共享和模态特异的局部特征,同时利用这两种特征计算草图和真实图像间的距离,减少不同模态间的差异.同时,提出多粒度局部对齐模块,对距离矩阵进行不同粒度的池化操作,在不同尺度上对齐局部特征,进一步解决特征不对齐问题.TSMLA能够充分利用草图和真实图像的信息,同时有效利用不同粒度特征间的联系.在多个数据集上的实验验证TSMLA的有效性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
韩雪昆
苗夺谦
张红云
张齐贤
关键词 草图图像检索特征提取特征融合跨模态检索    
Abstract:The goal of instance-level sketch-based image retrieval is to retrieve images by sketches. There is a significant modality gap and feature misalignment issue between sketches and images. In the existing methods, the modality gap between sketches and images cannot be effectively reduced, and only information at a single granularity is captured. Thus, features cannot be aligned effectively. To address these issues, a two stream multi-granularity local alignment network(TSMLA) is proposed. A two-stream feature extractor is introduced to extract both modality-shared and modality-specific local features. These features are simultaneously utilized to calculate the distance between the sketch and the image and reduce the differences between different modalities. Moreover, a multi-granularity local alignment module is adopted to pool the distance matrix at various granularities. Local features are aligned at different scales to effectively address the problem of feature misalignment. TSMLA can fully utilize the information of sketches and real images, while effectively utilizing the connections between features of different granularities. Experiments on multiple datasets validate the effectiveness of TSMLA.
Key wordsSketch-Based Image Retrieval    Feature Extraction    Feature Fusion    Cross-Modal Retrieval   
收稿日期: 2023-06-08     
ZTFLH: TP389.1  
基金资助:国家重点研发计划项目(No.2022YFB3104700)、国家自然科学基金项目(No.61976158,61976160,62076182)
通讯作者: 苗夺谦,博士,教授,主要研究方向为机器学习、数据挖掘、大数据分析、粒计算、人工智能、文本图像处理.E-mail:dqmiao@tongji.edu.cn.   
作者简介: 韩雪昆,硕士研究生,主要研究方向为图像检索、草图识别、机器学习.E-mail:2132958@tongji.edu.cn. 张红云,博士,副教授,主要研究方向为主曲线算法、粒计算、模糊集.E-mail:zhanghongyun@tongji.edu.cn. 张齐贤,博士研究生,主要研究方向为行人搜索、计算机视觉、目标检测.E-mail:zhangqx@tongji.edu.cn.
引用本文:   
韩雪昆, 苗夺谦, 张红云, 张齐贤. 双分支多粒度局部对齐的实例级草图图像检索[J]. 模式识别与人工智能, 2023, 36(8): 701-711. HAN Xuekun, MIAO Duoqian, ZHANG Hongyun, ZHANG Qixian. Instance-Level Sketch-Based Image Retrieval Based on Two Stream Multi-granularity Local Alignment Network. Pattern Recognition and Artificial Intelligence, 2023, 36(8): 701-711.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202308003      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2023/V36/I8/701
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn