模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2023, Vol. 36 Issue (11): 1009-1018    DOI: 10.16451/j.cnki.issn1003-6059.202311004
通信与多模态感知联觉机理和智能融合 最新目录| 下期目录| 过刊浏览| 高级检索 |
面向道路目标检测的多模态融合语义传输
朱增乐1, 魏智伟2, 张荣庆3, 杨柳青1
1.香港科技大学(广州) 智能交通学域 广州 511455;
2.同济大学 上海自主智能无人系统科学中心 上海 201210;
3.同济大学 软件学院 上海 201804
Multimodal Fusion-Based Semantic Transmission for Road Object Detection
ZHU Zengle1, WEI Zhiwei2, ZHANG Rongqing3, YANG Liuqing1
1. Intelligent Transportation Thrust, The Hong Kong University of Science and Technology(Guangzhou), Guangzhou 511455;
2. Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University, Shanghai 201210;
3. School of Software Engineering, Tongji University, Shanghai 201804

全文: PDF (1644 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在长尾效应的极端场景下,多车多传感器协作感知可为车辆提供有效的感知信息,但异构数据的差异化带宽限制和不同的数据格式使车辆在处理信息时难以进行统一高效的调度.为了在有限通信带宽下实现不同车辆间多传感器信息的有机融合,文中从语义通信的角度出发,提出基于Transformer的多模态融合目标检测语义通信模型.不同于传统的数据传输方案,文中模型利用自注意力机制融合不同模态的数据,着重探究各模态数据之间的语义相关性与依赖性.在有限的通信资源下帮助车辆进行信息传递和相互协作,提高车辆对复杂路况的理解能力.在Teledyne FLIR Free ADAS Thermal数据集上的实验表明,文中模型在多模态目标检测语义通信任务中表现出色,不仅大幅提升目标检测的准确性,同时也减少一半传输代价.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
朱增乐
魏智伟
张荣庆
杨柳青
关键词 道路目标检测异构数据语义通信多模态融合自注意力机制    
Abstract:In extreme scenarios with long-tail effects, collaborative perception involving multiple vehicles and sensors can provide effective sensory information for vehicles. However, the differentiation in heterogeneous data, coupled with bandwidth constraints and diverse data formats, makes it challenging for vehicles to achieve unified and efficient scheduling in processing. To organically integrate multi-sensor information among different vehicles under limited communication bandwidth, a semantic communication framework for multimodal fusion object detection based on Transformer is proposed in this paper. Unlike traditional data transmission solutions, self-attention mechanisms are utilized in the proposed framework to fuse data from different modalities, focusing on exploring the semantic correlation and dependencies among modal data. It helps vehicles transmit information and collaborate under limited communication resources, thereby enhancing their understanding of complex road conditions. The experimental results on Teledyne FLIR Free ADAS Thermal dataset show that the proposed model performs well in multimodal object detection semantic communication tasks with accuracy of object detection significantly improved and transmission costs reduced by half.
Key wordsRoad Object Detection    Heterogeneous Data    Semantic Communication    Multimodal Fusion    Self-Attention Mechanism   
收稿日期: 2023-10-11     
ZTFLH: TN919.8  
基金资助:国家重点研发计划项目(No.2022YFB3104200)、国家自然科学基金面上项目(No.62271351)、国家自然科学基金委员会项目(No.U23A20339)、广州市科技项目(No.2023A03J0011)、广东省教育厅科学研究重点项目(No.2023ZDZX1037)资助
通讯作者: 张荣庆,博士,副教授,主要研究方向为车联网、智慧交通、多智能体协同、网联智能.E-mail:rongqingz@tongji.edu.cn.   
作者简介: 朱增乐,博士研究生,主要研究方向为语义通信、人工智能.E-mail:zzhu622@connect.hkust-gz.edu.cn.魏智伟,博士研究生,主要研究方向为车载雾计算、计算资源分配.E-mail:2311769@tongji.edu.cn.杨柳青,博士,教授,主要研究方向为无线通信网络、多智能体系统、通讯感知一体化等.E-mail:lqyang@ust.hk.
引用本文:   
朱增乐, 魏智伟, 张荣庆, 杨柳青. 面向道路目标检测的多模态融合语义传输[J]. 模式识别与人工智能, 2023, 36(11): 1009-1018. ZHU Zengle, WEI Zhiwei, ZHANG Rongqing, YANG Liuqing. Multimodal Fusion-Based Semantic Transmission for Road Object Detection. Pattern Recognition and Artificial Intelligence, 2023, 36(11): 1009-1018.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202311004      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2023/V36/I11/1009
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn