模式识别与人工智能
首 页
期刊简介
编委会
投稿指南
伦理声明
联系我们
 
English
模式识别与人工智能
学术不端论文认定及处理办法
版权转让协议
保密证明
录用稿件电子版要求
修改说明格式
更多....
中国自动化学会
国家智能计算机研发中心
中科院合肥智能机械所
更多....
2026年 39卷 2期 刊出日期 2026-02-25
论文与报告
研究与应用
论文与报告
97
语义引导局部扰动的扩散模型对抗样本生成方法
赵宏, 许明婷, 刘泽
针对DiffAttack在语义引导、显著性区域及图像自然性等方面存在的问题,提出语义引导局部扰动的扩散模型对抗样本生成方法.首先,设计文本嵌入模块,在扩散模型去噪过程开始前对文本嵌入进行迭代优化,生成用于引导语义偏移的对抗性文本嵌入,作为引导去噪的条件.然后,在去噪过程中,加入局部掩码融合模块,在潜空间中对显著区域注入局部扰动,提升对抗样本的攻击性.最后,采用多层次联合感知损失函数,在图像与潜在空间层面联合约束感知差异,保持对抗样本攻击性的同时增强图像的自然性.在ImageNet-Compatible子集上以Inception作为代理模型生成对抗样本,并迁移至3种不同的模型架构中进行评估.结果显示,相比DiffAttack,文中方法的平均Top-1准确率降低2.8%,FID(Fréchet Inception Distance)指标提升0.4,说明文中方法生成的对抗样本在保持图像自然性的同时具有更强的攻击性,能更好地检测模型在安全性和鲁棒性方面存在的问题,具有更强的实用价值.
2026 Vol. 39 (2): 97-111 [
摘要
] (
29
) [
HTML
1KB] [
PDF
1568KB] (
27
)
112
基于判别性表示与自适应校准推理的跨域少样本命名实体识别
邱全安, 黄琪, 童梓荣, 罗文兵, 易洁, 王明文
针对跨域少样本命名实体识别任务因源域特征与目标域特征分布偏移导致的边界模糊与误差累积问题,提出基于判别性表示与自适应校准推理的跨域少样本命名实体识别模型(Discriminative Representation and Adaptive Calibrated Inference for Cross-Domain Few-Shot Named Entity Recognition, DR-ACI).首先,设计非对称边界对比损失重塑跨度检测空间,采用实体中心的非对称约束策略,在保持背景语义多样性的同时显式锐化实体边界.同时引入自适应门控增强模块,通过多层级语义融合对稀疏原型进行动态校准,降低因支持集样本稀疏带来的表征不确定性与偏差.然后,设计场景感知的自适应校准推理机制,针对特征模长漂移与支持集偏差瓶颈,利用特征归一化与可靠性感知的双模式门控策略,动态重构判决边界,抑制迁移噪声.实验表明,DR-ACI在Few-NERD数据集上具有一定的竞争力,同时在跨域数据集上性能较优,由此验证判别性表示与自适应推理协同优化的有效性.
2026 Vol. 39 (2): 112-126 [
摘要
] (
17
) [
HTML
1KB] [
PDF
1042KB] (
12
)
127
结合多级特征解耦与频域信息的深度伪造检测方法
林力伟, 李阳, 朱恒亮, 王猛强, 黄川, 陈建伟, 章静, 陈碧霞
深度伪造检测大多因泛化能力不足,难以应对未知伪造技术.因此,文中提出结合多级特征解耦与频域信息的深度伪造检测方法(Deepfake Detection Method Combining Multi-stage Feature Disentanglement and Frequency-Domain Information, MFD-FD).首先,设计多级特征解耦模块,并引入伪造抑制损失与重建损失,从浅到深逐步分离内容特征与伪影特征,既有效降低两者耦合程度又保留关键信息,使方法能聚焦于更高纯度的伪影特征.然后,引入频域信息,弥补空间特征在频谱信息上的不足,增强面对图像压缩等干扰条件下的检测稳定性.最后,设计余弦过渡融合增强模块,合成多样化伪造样本,增强鲁棒性.大量实验表明,MFD-FD的泛化性与鲁棒性较优.
2026 Vol. 39 (2): 127-140 [
摘要
] (
15
) [
HTML
1KB] [
PDF
2287KB] (
15
)
研究与应用
141
融合Mamba-Transformer的节奏感知舞蹈生成模型
胡正平, 徐传鑫, 董晓云, 吴一凡
针对音频驱动舞蹈生成任务中较难同时兼顾生成舞蹈动作质量及动作同音乐节拍对齐的问题,文中提出融合Mamba-Transformer的节奏感知舞蹈生成模型(Beat-Aware Dance Generation Model Integrating Mamba-Transformer, BeatDG).首先,设计上下肢动作特征编码网络,以无监督形式自主学习有意义的舞蹈单元,组成码本库.然后,为了有效提升音乐节拍提取能力,设计节拍特征提取模块,在保证计算效率的同时,注重音乐节拍与舞蹈动作的时序建模.在此基础上,构建节拍门控因果注意力模块,用于音乐信息与上下肢特征之间的信息交互.最后,设计基于Mamba-Transformer的节拍对齐舞蹈生成模块,同时考虑连续的帧间特征和全局信息,融合上下肢及音乐信息,生成符合空间标准和范式的舞蹈动作.在AIST++数据集上的实验表明,BeatDG在有效提升音乐节拍与舞蹈动作对齐程度的同时,可保证生成舞蹈动作的质量.
2026 Vol. 39 (2): 141-156 [
摘要
] (
23
) [
HTML
1KB] [
PDF
2958KB] (
16
)
157
基于单步扩散和量化语义的极端图像压缩方法
张洲弘, 乔欣, 李智远, 安宁, 孔贺
近年来,基于扩散模型的极端图像压缩方法在极低码率场景中性能显著优于传统方法.然而,这类方法依赖扩散模型的逐步去噪策略,通常需要多次采样才能完成解码,在重建保真度与推理效率之间存在一定的局限性,并且现有方法难以精准保留航拍场景中的地形结构与细节特征.因此,文中提出基于单步扩散和量化语义的极端图像压缩方法.设计单步扩散策略,从压缩特征而非纯噪声出发,仅通过一次采样即可实现高质量的图像重建.同时,引入量化CLIP特征替代文本条件,兼顾语义表达与传输效率,为重建过程提供精细稳定的语义约束.此外,在训练中融合像素级损失,结合潜在特征空间优化与像素域监督,缓解分布差异问题,进一步提升重建质量.大量实验表明,文中方法在仅使用一次采样的情况下即可达到较优的重建效果.
2026 Vol. 39 (2): 157-169 [
摘要
] (
14
) [
HTML
1KB] [
PDF
3057KB] (
18
)
170
基于知识图谱与指代消解的对话式问答
王笳辉, 赵林超, 尹兆睿, 岳昆, 陈兴通, 段亮
如何解决对话式问答中的指示代词和长依赖现象,有效利用依赖信息,以及如何有效维护上下文查询子图,避免因不当扩展而导致的子图过度增长的风险,在上下文查询子图中精准检索问题的答案是当前对话式问答亟待解决的问题.为此,文中提出基于知识图谱与指代消解的对话式问答模型.首先,将指代消解应用于对话式问答,利用指代消解模块获取指代簇,并提出索引替换算法,完善问题的语义信息.同时,提出词汇指代结构和字符语义两种依赖计算方式,获取依赖信息,指导上下文查询子图的扩展和答案检索.然后,为了有效扩展上下文查询子图并避免过度增长,基于依赖信息扩展查询子图,得到准确的查询子图,进而根据对话轮次和查询子图大小提出奖惩机制,有效防止子图过度增长.最后,将依赖信息用于答案检索,有效提升答案检索准确率.在ConvQuestions数据集上的实验表明文中模型的有效性.
2026 Vol. 39 (2): 170-182 [
摘要
] (
18
) [
HTML
1KB] [
PDF
912KB] (
24
)
183
空-频域交替自注意力的可见光遥感图像超分辨率重建网络
刘杰, 程立明
可见光遥感图像的超分辨率重建需协同优化局部纹理恢复与长程结构一致性,传统Transformer网络虽能建模长程依赖,却在高频纹理上敏感度不足.为此,文中提出空-频域交替自注意力的可见光遥感图像超分辨率重建网络,通过串行交替的频域自注意力与空间自注意力,分别建模图像的局部纹理关系与跨区域长程依赖.设计相位感知频域自注意力机制,实现频域自注意力计算,显式建模频域相位差,增强高频纹理重建能力.构建通道增强置换自注意力机制,实现空间域自注意力计算,加入通道注意力,增强特征表征能力,强化全局结构一致性.实验表明,文中网络可有效解决高频信息缺失与结构断裂问题,提升图像重建质量.
2026 Vol. 39 (2): 183-192 [
摘要
] (
24
) [
HTML
1KB] [
PDF
1623KB] (
20
)
模式识别与人工智能
主管:中国科学技术协会
主办:中国自动化学会
国家智能计算机研究开发中心
中国科学院合肥智能机械研究所
出版:科学出版社
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由
北京玛格泰克科技发展有限公司
设计开发 技术支持:support@magtech.com.cn