模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2025年 38卷 8期 刊出日期 2025-08-25

论文与报告
研究与应用
 
论文与报告
669 多模态序列推荐场景下融合多维感知的自蒸馏多任务学习
汤哲, 庞继芳, 解宇, 王智强
作为推荐系统的一个重要应用场景,多模态序列推荐已成为当前工业界与学术界研究的焦点之一.然而,现有面向多模态序列推荐的多任务学习方法未充分考虑模态内部的高阶关系及短期序列的增强作用,在语义表达和兴趣表征学习方面能力有限,导致个性化程度不高.因此,文中提出多模态序列推荐场景下融合多维感知的自蒸馏多任务学习模型(Self-Distillation Multi-task Learning Integrating Multi-dimensional Perception for Multimodal Sequential Recommendation, SD-MTMP).首先,在对用户评论进行主题提取的基础上,构建用户-主题超图和项目-主题超图,分别建模用户群体与项目集合内部的高阶语义关联,生成主题感知的节点表征,并基于用户-项目评分矩阵构建加权二部图,生成评分感知的节点表征.然后,设计跨模态自蒸馏辅助任务,通过主题感知表征向评分感知表征的知识迁移实现语义对齐.同时,综合考虑用户评分与时间间隔对短期序列的影响,建立双重感知注意力机制,精准建模用户的短期兴趣.在此基础上,提出适用于多模态序列推荐的多任务学习策略,通过推荐损失与自蒸馏损失的联合优化,进一步增强表征语义,提升推荐性能.最后,在3个公开数据集上的实验表明SD-MTMP的有效性.
2025 Vol. 38 (8): 669-683 [摘要] ( 191 ) [HTML 1KB] [PDF 838KB] ( 160 )
684 基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络
孙林, 薛红科, 吕娟
皮肤病变的准确分割对诊断和治疗皮肤病至关重要.针对现有网络因皮肤病变形态多样、与周围组织相似性较高及边界模糊导致的分割结果不精准的问题,文中提出基于动态代理瓶颈与多尺度空洞注意力的Swin Transformer皮肤病分割网络.首先,针对普通卷积对全局信息捕捉能力不足的问题,构建基于Swin Transformer V2的骨干网络,通过分层结构设计和自注意力机制,实现多尺度特征融合,建立特征的长距离依赖关系,增强多形态下皮肤病变的语义特征提取能力.然后,为了增强网络的特征表达能力,设计动态代理瓶颈模块,根据输入特征自适应生成代理向量与位置偏置,自适应调整局部感受野的关注焦点,进一步解决现有网络在高相似度皮肤组织干扰下皮肤病变分割偏差的问题.最后,为了提高对皮肤病变边缘的感知能力,设计多尺度空洞注意力融合模块,构建基于多分支并行的多尺度空洞卷积特征提取架构,结合空间通道注意力机制,提升对病变边缘的敏感性.文中网络在ISIC2017、PH2、ISIC2018数据集上的实验均取得较优性能,由此验证其有效性.
2025 Vol. 38 (8): 684-698 [摘要] ( 96 ) [HTML 1KB] [PDF 2325KB] ( 102 )
699 可信伪标签增强的模式兴趣主动学习评估框架
王甜, 王璐, 谢文波, 王欣
频繁模式挖掘(Frequent Pattern Mining, FPM)是图数据挖掘领域中的关键任务之一,目标是从大规模图数据中挖掘支持度高于预设阈值的模式.受评估指标单一且忽略主观偏好的制约,FPM往往面临挖掘结果与用户需求匹配度较低的问题.因此,文中提出可信伪标签增强的模式兴趣主动学习评估框架(Certified Pseudo-label Enhanced Active Learning Framework for Pattern Interest Evaluation, CPALF),旨在通过少量用户交互,精准预测用户对模式的主观偏好.CPALF采用主动学习策略,通过人机交互高效收集用户偏好,实现对用户兴趣的建模.考虑到仅依赖有限的标注数据训练模型面临的诸多挑战,CPALF进一步融合半监督学习机制,面向未标记数据生成带有可信伪标签的训练样本,在降低对标注数据依赖的同时,显著提升模型预测效果.实验表明,CPALF能高效捕捉用户的主观偏好,并在少量标注数据的情况下,获得较高的预测准确率.
2025 Vol. 38 (8): 699-713 [摘要] ( 115 ) [HTML 1KB] [PDF 940KB] ( 108 )
研究与应用
714 驾驶场景下基于场景图嵌入融合光流特征的风险识别方法
肖尧, 杨一箭, 苟超
多模态交通参与者的时空交织与行为互动复杂且难以精准识别,增加驾驶风险识别的难度.为此,文中构建虚拟交通场景图数据集CARLA_242,用于碰撞风险评估,数据集涵盖7类交通参与者及16种场景图关系.同时提出基于场景图嵌入融合光流特征的风险识别方法,包含如下三个核心模块.空间建模模块采用多关系图卷积网络联合编码节点特征与关系信息,再通过图池化与读出操作,生成场景图嵌入;光流提取模块对视频序列进行光流估计,提取表征动态运动的光流特征;时空建模模块采用Temporal Transformer Encoder,对场景图嵌入与光流特征的融合表示进行时序建模,实现驾驶风险识别.在3个场景图数据集上的实验表明文中方法性能较优,实验结果验证场景图与光流特征多模态融合在驾驶风险识别中的有效性.
2025 Vol. 38 (8): 714-726 [摘要] ( 86 ) [HTML 1KB] [PDF 1376KB] ( 80 )
727 基于局部属性生成对抗网络的目标检测对抗攻击算法
许佳诺, 邵伟, 张道强
现有针对目标检测模型的对抗攻击算法大多无法在取得高攻击成功率的同时保证对抗样本的隐蔽性,削弱其在医学领域应用中的有效性.为此,文中提出基于局部属性生成对抗网络的目标检测对抗攻击算法,旨在优化对抗样本质量的同时提升攻击效果.首先,通过图像块划分构建图像的图结构,引入基于图结构的局部属性差异损失,增强对抗样本的视觉隐蔽性.然后,加入目标误定位攻击损失,引导检测模型产生错误的目标定位,增强攻击的有效性.最后,结合上述两种损失,通过反向传播更新生成对抗网络.在BCCD、LISC两个公开的血液细胞数据集上的实验表明,文中算法针对Faster-RCNN生成的对抗样本在攻击成功率和隐蔽性方面均较优,拥有良好的攻击迁移性.
2025 Vol. 38 (8): 727-739 [摘要] ( 85 ) [HTML 1KB] [PDF 3035KB] ( 81 )
740 基于自适应粒球与纯净簇拆分的开放意图分类
王景凯, 李艳花, 刘家芬, 王向坤, 杨新
开放意图分类是构建智能对话系统的重要任务之一,其目标是在识别已知意图的同时准确检测未知意图.然而,现有方法在建模复杂语义结构方面存在局限,难以刻画类别内部的多样性分布,容易导致类间混淆.为此,文中提出基于自适应粒球与纯净簇拆分的开放意图分类方法(Adaptive Granular-Ball and Pure Cluster Splitting for Open Intent Classification, AGPCS-OIC).首先,通过自适应粒球聚类构建反映数据真实分布的多中心子类结构,刻画类内异质性.然后,引入结构稀疏性驱动的纯净簇拆分策略,进一步划分边界松散但纯度较高的粒球,提升决策边界的表达能力和对未知类别的排斥能力.同时,结合粒球感知对比学习机制,以粒球中心为锚点构建结构级语义对,引导模型在特征空间中增强类内聚合性与类间可分性.实验表明,AGPCS-OIC在多个开放意图分类数据集上性能较优.
2025 Vol. 38 (8): 740-751 [摘要] ( 66 ) [HTML 1KB] [PDF 1272KB] ( 59 )
752 基于花蕊卷积网络的多囊卵巢综合征风险预测
罗烈, 汪涛, 陈冰菁, 吴晓园, 林中燕
在现有多囊卵巢综合征(Polycystic Ovary Syndrome, PCOS)临床数据分析应用中,多数模型存在欠拟合、卷积神经网络受限于感受野等问题.因此,文中提出基于花蕊卷积网络(Stamen-Pistil Convolutional Network, SPCNet)的PCOS风险预测.SPCNet的设计借鉴花朵中雄蕊与雌蕊的协同结构:雌蕊卷积沿纵向贯穿信息主干,提取全局特征;雄蕊卷积在横向邻域进行补充采样.该网络将花蕊空间结构引入卷积算子的设计中,将采样空间扩展至纵横双向,有效弥补现有PCOS处理模型的缺点.在两个公开的PCOS数据集上的对比实验表明,SPCNet不仅实现轻量化和计算效率的提升,同时在预测精度上也具有一定优势,可较好地满足PCOS复杂临床数据的即时预测需求.
2025 Vol. 38 (8): 752-763 [摘要] ( 77 ) [HTML 1KB] [PDF 1805KB] ( 77 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn