模式识别与人工智能

主管：中国科学技术协会
主办：中国自动化学会
　　　国家智能计算机研究开发中心
　　　中国科学院合肥智能机械研究所
出版：科学出版社

下载中心更多>>

编辑部公告更多>>

当期目录
过刊浏览

2025年, 第38卷, 第12期　刊出日期：2026-02-10

论文与报告

基于Transformer融合的深度对比多视图聚类

李顺勇, 原志英, 赵兴旺

2025, 38(12): 1057-1074. 摘要 ( ) | PDF全文 ( ) | HTML ( )

作为无监督学习的重要任务之一,多视图聚类旨在融合异构视图信息并挖掘一致的聚类结构.现有方法大都存在利用自编码器提取的低级特征缺乏跨视图语义一致性、简单融合策略缺乏对视图质量的动态评估、缺少多层面的对比约束和局部-全局标签对齐机制等问题.为此,文中提出基于Transformer融合的深度对比多视图聚类算法(Deep Contrastive Multi-view Clustering with Transformer Fusion, DCMCTF).首先,设计交替对抗学习模块,实现低级特征分布的跨视图对齐.然后,引入实例级和聚类级双重对比约束模块,增强跨视图一致性和特征判别能力.最后,构建基于Transformer的自适应融合模块,动态学习视图关联,结合质量感知评分生成鲁棒共识表示,并将由共识表示得到的全局标签与特定视图的局部标签进行对齐.在9个数据集上的实验表明,DCMCTF聚类性能较优.
面向集值决策系统的集值模糊粒球粗糙集模型与属性约简算法

罗忠团, 谭安辉, 顾沈明, 吴伟志

2025, 38(12): 1075-1090. 摘要 ( ) | PDF全文 ( ) | HTML ( )

粒球计算作为一种有效的多粒度数据处理范式,在复杂数据分析与知识约简领域展现出巨大潜力.然而,现有粒球计算模型未能充分刻画集值属性蕴含的模糊性与不确定性,限制其在集值决策系统中的应用.为此,文中提出集值模糊粒球粗糙集模型,并设计相应的属性约简算法.首先,提出基于集值数据的粒球生成算法,实现依据集值特征的数据空间动态粒化.然后,引入模糊粒球容差关系与近似算子,系统分析其数学性质并给出证明.进一步地,基于依赖度构建前向贪心属性约简算法,实现属性约简.实验表明,文中属性约简算法不仅能获得更精简的属性约简集,还在CART、SVM分类器上取得较高的平均分类精度,验证算法在集值决策系统中的有效性与优越性.
用于超图对齐的多视图对比学习

牛长宇, 张海峰, 张晓明

2025, 38(12): 1091-1107. 摘要 ( ) | PDF全文 ( ) | HTML ( )

网络对齐致力于挖掘不同网络间节点的对应关系,是跨不同领域集成信息的关键任务之一,但现有方法大多关注普通图,忽略现实世界系统中普遍存在的高阶群体交互,而为数不多的现有超图对齐方法往往只依赖浅层的局部拓扑信息,无法捕捉深层的结构语义.为了解决此问题,文中提出超图-团展开对比学习(HCCL)的多视图对比学习方法,从高阶与低阶两个互补的层面协同捕捉节点的结构特征,旨在有效利用超图丰富的结构信息完成对齐任务.具体而言,同时利用原始超图及其团展开图作为两个视图:原始超图通过超图卷积网络学习高阶群组关系,团展开图通过图卷积网络捕捉低阶成对关系.在此基础上引入跨视图对比学习机制,最大化同一节点在不同视图下嵌入表示的一致性,提取跨越不同结构尺度且更鲁棒和全面的节点特征.在真实数据集上的大量实验充分表明HCCL的有效性.

研究与应用

基于区域上下文感知的人群计数方法

洪致远, 高欣健, 任梦妍, 王希临, 高隽

2025, 38(12): 1108-1120. 摘要 ( ) | PDF全文 ( ) | HTML ( )

面对人群计数任务中复杂场景下密度不均与尺度多变等问题,现有基于Transformer的方法在处理跨尺度上下文时,往往忽略对空间信息与通道信息的利用.因此,文中提出基于区域上下文感知的人群计数方法.首先,设计区域引导模块,为各特征位置自适应分配关注区域,从而引入区域级上下文,较好地适应非均匀密度分布.然后,构建空间-通道上下文感知模块,在空间与通道两个维度上实现特征交互,构建跨维度的区域依赖,增强方法对前景区域与背景区域的判别能力.最后,在训练阶段进一步引入分布级约束,提升预测密度分布与真实分布的一致性.文中方法在JHU-Crowd++、ShanghaiTech数据集上的实验表现较优,验证其在复杂场景中的鲁棒性与泛化性.
强化用户语义表示的多模态推荐方法

许昊, 夏鸿斌, 王晓锋

2025, 38(12): 1121-1134. 摘要 ( ) | PDF全文 ( ) | HTML ( )

现有的多模态推荐方法通常分别提取图像、文本等模态特征并在训练阶段进行浅层融合,难以充分挖掘跨模态语义.此外,主流方法多采用随机初始化的用户表示,容易导致用户表示区分度不足.为此,文中提出强化用户语义表示的多模态推荐方法(Multimodal Recommendation with User Semantic Embedding Refinement, USERec),分别从物品角度和用户角度缓解现有问题.在物品侧,利用多模态大语言模型,以物品的文本模态指导视觉模态特征提取,实现深度语义融合,获得更适用于推荐任务的物品表示.在用户侧,为用户表示引入位置编码,增强用户索引空间的频谱多样性,并结合度敏感剪枝构建个性化局部图,再通过随机采样注意力机制补充用户的全局感知,增强用户表示的区分度.在4个真实数据集上的实验表明USERec的有效性.
基于多模态图像特征融合的无人机目标检测方法

薛文辉, 陈忠诚, 陈珺, 王勇

2025, 38(12): 1135-1148. 摘要 ( ) | PDF全文 ( ) | HTML ( )

多模态图像在感知层面具有显著互补性,其中红外图像在低光照和复杂背景中具备稳定的目标响应能力,而可见光图像能提供丰富的纹理与细节信息,两者融合有助于提升复杂环境下无人机目标检测的鲁棒性与精度.为此,文中提出基于多模态图像特征融合的轻量化无人机目标检测方法(UAV Target Detection Method Based on Multimodal Image Feature Fusion, MIFF-UAVDet),以YOLOv7-tiny为主干结构,构建红外与可见光双分支结构,分别对两种模态进行特征提取,为后续特征融合提供互补的特征表示.进一步地,设计轻量级多尺度空间注意力融合模块,通过通道压缩模块、多尺度深度可分离卷积、多尺度空间注意力机制,引导模态间信息在空间维度上自适应融合,增强特征表达能力.同时改进CIoU(Complete Intersection over Union),设计HWCIoU(Height-Width Constrained CIoU),引入针对目标长宽比的强约束机制,使预测框在回归过程中能精确匹配真实框形状.在2个公开的多模态无人机目标检测数据集上的实验表明,MIFF-UAVDet在检测精度、定位精度及推理速度等方面均较优,尤其在复杂背景、光照变化及目标尺度差异较大的场景中表现出较强的鲁棒性.

选择文件类型/文献管理软件名称

选择包含的内容

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容