模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2024, Vol. 37 Issue (9): 770-785    DOI: 10.16451/j.cnki.issn1003-6059.202409002
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
边界感知引导多层级特征的知识蒸馏交通场景语义分割算法
谢新林1,2, 段泽云1,2, 罗臣彦1,2, 谢刚1,2
1.太原科技大学 电子信息工程学院 太原 030024;
2.太原科技大学 先进控制与装备智能化山西省重点实验室 太原 030024
Traffic Scene Semantic Segmentation Algorithm with Knowledge Distillation of Multi-level Features Guided by Boundary Perception
XIE Xinlin1,2, DUAN Zeyun1,2, LUO Chenyan1,2, XIE Gang1,2
1. School of Electronic Information Engineering, Taiyuan University of Science and Technology, Taiyuan 030024;
2. Shanxi Key Laboratory of Advanced Control and Equipment Intelligence, Taiyuan University of Science and Technology, Taiyuan 030024

全文: PDF (7543 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对交通场景目标细节信息丢失与模型参数量过大等问题,提出边界感知引导多层级特征的知识蒸馏交通场景语义分割算法,以较少的参数量平滑目标分割边界.首先,构建自适应融合多层级特征模块,融合深层语义信息和浅层空间信息的多层级特征,选择性地突出目标边界信息和目标主体信息.然后,提出交互注意力融合模块,建模空间维度和通道维度的长距离依赖关系,增强不同维度间的信息交互能力.最后,提出基于候选边界的边界损失函数,构建基于细节感知的边界知识蒸馏网络,迁移复杂教师网络中的边界信息.在交通场景数据集Cityscapes和CamVid上的实验表明,文中算法能在实现轻量化的同时保持良好的分割性能,并在处理小目标和细长条目标时具有一定优势.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
谢新林
段泽云
罗臣彦
谢刚
关键词 语义分割深度学习知识蒸馏交通场景注意力机制    
Abstract:To solve the problems of object detail information loss and large model parameters in traffic scenes, a traffic scene semantic segmentation algorithm with knowledge distillation of multi-level features guided by boundary perception is proposed. The proposed algorithm can smooth the object segmentation boundaries with fewer parameters. First, the adaptive fusing multi-level feature module is constructed to integrate the multi-level features of deep semantic information and shallow spatial information. The object boundary information and object subject information are highlighted selectively. Second, an interactive attention fusion module is proposed to model the long-range dependencies in spatial and channel dimensions, enhancing the information interaction capabilities between different dimensions. Finally, a boundary loss function based on candidate boundaries is proposed to construct a boundary knowledge distillation network based on detail awareness and transfer boundary information from complex teacher networks. Experiments on the traffic scene datasets Cityscapes and CamVid demonstrate that the proposed algorithm achieves a lightweight model while gaining positive segmentation performance, maintaining significant advantages in dealing with small and slender objects.
Key wordsKey Words Semantic Segmentation    Deep Learning    Knowledge Distillation    Traffic Scene    Attention Mechanism   
收稿日期: 2024-07-31     
ZTFLH: TP 391.4  
基金资助:国家自然科学基金项目(No.62006169)、山西省重点研发计划项目(No.202202010101005)、山西省基础研究计划面上项目(No.202303021221141)、太原市关键核心技术攻关“揭榜挂帅”项目(No.2024TYJB0137)资助
通讯作者: 谢新林,博士,副教授,主要研究方向为图像语义分割、深度学习等.E-mail:xiexinlin@tyust.edu.cn.   
作者简介: 段泽云,硕士研究生,主要研究方向为深度学习、图像语义分割等.E-mail:s202315210574@stu.tyust.edu.cn.罗臣彦,硕士研究生,主要研究方向为深度学习、图像语义分割等.E-mail:S20201503009@stu.tyust.edu.cn.谢 刚,博士,教授,主要研究方向为先进控制、机器视觉、故障诊断等.E-mail:xiegang@tyust.edu.cn.
引用本文:   
谢新林, 段泽云, 罗臣彦, 谢刚. 边界感知引导多层级特征的知识蒸馏交通场景语义分割算法[J]. 模式识别与人工智能, 2024, 37(9): 770-785. XIE Xinlin, DUAN Zeyun, LUO Chenyan, XIE Gang. Traffic Scene Semantic Segmentation Algorithm with Knowledge Distillation of Multi-level Features Guided by Boundary Perception. Pattern Recognition and Artificial Intelligence, 2024, 37(9): 770-785.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202409002      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I9/770
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn