模式识别与人工智能
首 页
期刊简介
编委会
投稿指南
伦理声明
联系我们
 
English
模式识别与人工智能
学术不端论文认定及处理办法
版权转让协议
保密证明
录用稿件电子版要求
修改说明格式
更多....
中国自动化学会
国家智能计算机研发中心
中科院合肥智能机械所
更多....
2025年 38卷 7期 刊出日期 2025-07-25
论文与报告
研究与应用
论文与报告
577
基于语义协同感知注意力的水下图像增强网络
杨静, 梁辉, 朱文瀚, 杨烁, 吴志泽
针对水下成像中光衰减与散射导致的图像退化难题,提出基于语义协同感知注意力的水下图像增强网络.首先,设计双路径竞争的感知注意力机制,将滑动窗口注意力与池化注意力融合于Softmax中进行计算.同步捕捉图像的粗粒度特征和细粒度特征,实现多尺度特征感知.然后,引入卷积门控线性单元,实现通道混合器的注意力化.在此基础上,构建集成感知注意力和卷积门控线性单元的级联感知注意力网络,用于捕获和融合水下退化图像的局部信息与全局信息.最后,设计特征主导模块,嵌入和协同语义特征,增强对水下场景语义的理解与表达能力,使增强过程不仅聚焦于像素级修复,还能实现语义层面的场景重建.实验表明,文中网络具有较优的泛化性和在下游视觉工程任务中的应用价值.
2025 Vol. 38 (7): 577-595 [
摘要
] (
207
) [
HTML
1KB] [
PDF
8095KB] (
150
)
596
基于大语言模型双向协同的跨模态交互式图像编辑方法
石慧, 金聪慧
扩散模型在图像生成任务中表现出较高的视觉保真度,但在图像编辑方面仍面临用户意图理解偏差、局部细节控制不足、交互响应滞后等的问题.为此,文中提出基于大语言模型双向协同的跨模态交互式图像编辑方法(Cross-Modal Interactive Image Editing Method Based on Bidirectional Collaboration between Large Language Models and User Interaction, BiC-LLM),其核心是一种双向协同控制机制,将大语言模型自顶向下的高级语义引导与用户直接参与的自底向上底层视觉控制有机融合,通过语义增强、特征解耦与动态反馈机制提升图像编辑的可控性与精度.首先,设计层次化语义驱动模块,使用大语言模型对用户输入文本进行语义解耦与推理,生成细粒度语义向量,精准理解用户意图.然后,构建视觉-结构解耦的动态控制模块,结合多层视觉特征提取器与对象级建模,实现图像全局结构与局部风格的独立控制.最后,引入实时交互机制,支持掩膜标注与参数调节,实现图像编辑过程的动态优化.在LSUN、CelebA-HQ、COCO数据集上的实验表明,BiC-LLM在文本一致性、结构稳定性与交互控制方面均较优,能实现复杂场景下的多对象语义编辑,并保持非编辑区域的内容一致性,由此验证其在图像编辑任务中的有效性与鲁棒性.
2025 Vol. 38 (7): 596-612 [
摘要
] (
101
) [
HTML
1KB] [
PDF
5040KB] (
95
)
613
基于思维链和语义解耦的层次化主题模型
王志华, 李旸, 李德玉, 王素格
层次主题模型可以挖掘文档中的隐含主题,建模主题间的层次结构关系,为数据治理、信息检索、内容分类和知识管理等应用提供技术支持.文中提出基于思维链和语义解耦的层次化主题模型.首先,建立基于思维链的层次主题生成模块,设计层次化主题生成思维链,指导大语言模型(Large Language Model, LLM)生成初步的主题层次结构.然后,引入基于LLM的主题相似判别机制,生成精炼的主题,并利用样例指导LLM实现主题合并,提升生成主题的质量.最后,建立基于传输规划和语义解耦的主题层次优化模块,将初始层次主题结构作为下游建模的主题先验,构建主题关键词、文档主题分布和主题距离,并将主题层次关系建模为最优运输问题,结合上下层主题关键词进行父子主题解耦,优化主题层次结构.在NeurIPS、ACL、20 Newsgroups等涵盖新闻与学术论文的多个标准公开数据集上的实验表明,文中模型在主题质量指标和层次化指标上均取得较优值.
2025 Vol. 38 (7): 613-626 [
摘要
] (
95
) [
HTML
1KB] [
PDF
890KB] (
203
)
研究与应用
627
基于属性直观图的属性约简动态更新
白璞, 万青, 马盈仓, 魏玲
属性约简是形式概念分析中的热点研究方向之一,研究其动态更新方法在知识发现领域具有重要意义.属性直观图是形式背景的Hasse图表示形式,通过属性直观图可得到保持概念格结构不变的属性约简.因此,文中针对形式背景中属性集变化情况,通过属性直观图的动态更新规律研究此类属性约简的动态更新方法.首先,通过属性的上(下)近邻关系给出属性直观图关系矩阵的定义,并研究该关系矩阵的性质.然后,针对删除属性和增加属性两种情况,分别给出基于关系矩阵的属性直观图的更新方法.最后,借助属性直观图的更新规律给出属性特征的变化规律,进而得到属性约简的动态更新方法.该方法进一步丰富属性约简理论,数值实验说明该方法的有效性.
2025 Vol. 38 (7): 627-640 [
摘要
] (
76
) [
HTML
1KB] [
PDF
785KB] (
88
)
641
基于局部差分与全局谱融合的图异常检测
徐登彬, 袁立宁, 吴沛宸, 刘钊
图神经网络在图异常检测任务中性能较优,但现有研究大多存在难以识别异常伪装、标签稀缺条件下性能不足等问题.针对上述问题,文中提出基于局部差分与全局谱融合的图异常检测方法(Graph Anomaly Detection Based on Local Differential and Global Spectral Fusion, GAD-LDSF),同时从空间域与频域进行特征嵌入,提升在异常伪装与标签稀缺条件下的检测性能.首先,利用基于软量化的概率自适应嵌入实现数据增强,通过图差分注意力网络精准捕获节点间的细微差异,生成空间域节点表示.然后,构建全局同构化动态频谱增强,利用Chebyshev多项式高效捕捉全局范围的异常信号,生成频域节点表示.最后,动态融合空间域与频域节点表示,并利用预测器实现异常节点检测.在3个基准数据集上的实验表明,GAD-LDSF整体性能较优,尤其是在应对异常伪装与标签稀缺等挑战时表现出较强的鲁棒性与泛化性.
2025 Vol. 38 (7): 641-654 [
摘要
] (
99
) [
HTML
1KB] [
PDF
3183KB] (
94
)
655
基于边界信息与对比学习的图像篡改检测网络
王轶群, 高燕程
针对复杂场景下图像篡改检测中边缘信息和高频特征利用不足的问题,提出基于边界信息与对比学习的图像篡改检测网络.首先,设计动态权重更新策略,优化图像高频信息的特征提取能力.然后,结合边缘检测算法与篡改区域检测算法,提取并增强图像的边缘特征,提升异常信息的显著性.最后,引入对比学习机制,构建正负样本对进行特征对比,优化对像素分布差异的判别能力,实现对篡改区域的精准定位.在多个公开数据集上的实验表明,文中网络在复杂场景下表现出良好的泛化能力和对细微篡改痕迹的识别能力,为图像篡改检测提供新的解决方案,具有较高的实际应用价值,可广泛应用于信息安全与数字取证等领域.
2025 Vol. 38 (7): 655-667 [
摘要
] (
105
) [
HTML
1KB] [
PDF
3612KB] (
102
)
模式识别与人工智能
主管:中国科学技术协会
主办:中国自动化学会
国家智能计算机研究开发中心
中国科学院合肥智能机械研究所
出版:科学出版社
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由
北京玛格泰克科技发展有限公司
设计开发 技术支持:support@magtech.com.cn