模式识别与人工智能
首 页
期刊简介
编委会
投稿指南
伦理声明
联系我们
 
English
模式识别与人工智能
学术不端论文认定及处理办法
版权转让协议
保密证明
录用稿件电子版要求
修改说明格式
更多....
中国自动化学会
国家智能计算机研发中心
中科院合肥智能机械所
更多....
2024年 37卷 8期 刊出日期 2024-08-25
现实场景下的检测与识别算法
论文与报告
研究与应用
现实场景下的检测与识别算法
663
窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测
张荣国, 秦震, 胡静, 王丽芳, 刘小君
为了从小目标有限特征中获取关键的有效信息,提升小目标的定位能力和检测精度,文中提出窗口锚定的偏移受限动态蛇形卷积网络航拍小目标检测方法.首先,构造偏移受限动态蛇形卷积,在不同方位动态偏移,受限蛇形卷积核自适应地关注不同大小和形状的特征区域,使特征提取聚焦于微小局部结构,促进小目标特征的捕获.然后,采用双阶段多尺度特征融合方法,对不同层阶特征图进行特征对齐、融合和注入,增强底层细节信息与高层语义信息的融合,并强化不同尺寸目标信息传输,提高小目标的检测能力.与此同时,设计窗口锚定的边界框回归损失函数,基于辅助边界框和最小点距离进行边界回归,获得准确的回归结果,提高小目标的定位能力.最后,在3个航拍数据集上的实验表明,文中方法对小目标的检测性能有不同程度的改善和提高.
2024 Vol. 37 (8): 663-677 [
摘要
] (
283
) [
HTML
1KB] [
PDF
6317KB] (
248
)
678
语义重建的动态监督伪装物体检测
姜文涛, 王柏涵
伪装物体检测旨在分离视觉上高度融入周围环境的物体,但是物体前景与背景存在大量相似干扰,导致分割过程中易于出现明显错误.针对上述问题,文中提出基于语义重建的动态监督伪装物体检测网络(Dynamic Supervised Camouflaged Object Detection Network with Semantic Reconstruction, DSSRNet),通过重建特征图的空间语义和引入置信度指导网络训练,实现对伪装物体的准确分割.首先,提出空间语义低秩重建机制,精细感知不同尺度下伪装物体具有区分性的语义特征.然后,生成预测置信度图,对分割过程进行动态监督,减少网络因过于自信造成的假阳性和假阴性判断.最后,提出模糊感知损失函数,对网络施加强约束,改善预测时产生的图像模糊问题.在3个具有挑战性的基准数据集上的实验表明,DSSRNet可较好地排除相似信息干扰,取得精准的分割效果.
2024 Vol. 37 (8): 678-691 [
摘要
] (
127
) [
HTML
1KB] [
PDF
2940KB] (
120
)
692
基于改进RetinaNet的轻量化钢材表面缺陷检测算法
王伟家, 张宇, 王京华, 徐勇
相对实际应用需求而言,现有的钢材表面缺陷检测算法存在检测速度较慢、准确率较低等问题.因此,文中提出基于改进RetinaNet的轻量化钢材表面缺陷检测算法.首先,将原有的骨干网络替换为轻量化网络,引入跨阶段局部结构,实现梯度的有效传播和轻量化.然后,采用深度可分离卷积替换传统卷积层,进一步降低参数量,提高检测速度.为了弥补轻量化导致的算法精度下降问题,提出基于跨阶段局部结构的空间金字塔池化机制,融合不同尺度的特征,有效提升算法的检测精度.在NEU-DET数据集和自建的HBIS数据集上的实验表明,相比已有的缺陷检测算法,文中算法在精度更高的同时,达到更快的检测速度,相应的软硬件系统满足生产线的实时在线检测要求并已上线运行.
2024 Vol. 37 (8): 692-702 [
摘要
] (
206
) [
HTML
1KB] [
PDF
1626KB] (
201
)
703
基于跨通道特征增强图卷积网络的骨架行为识别
吴志泽, 陈盛, 檀明, 孙斐, 杨静
受限于图卷积网络的局部操作模式,传统图卷积网络骨架行为识别方法难以建模远关节点关系和长时间信息,无法捕捉动作间的局部微小变化.因此,文中提出基于跨通道特征增强图卷积网络的骨架行为识别(Cross-Channel Feature-Enhanced Graph Convolutional Network for Skeleton-Based Action Recognition, CFE-GCN),包括双部分分组图卷积模块、跨阶段部分密集连接模块及多尺度时间卷积模块.双部分分组图卷积模块采用分组策略,对人体关节点建模,提取多粒度特征,捕获关节点之间的局部细微差异.跨阶段部分密集连接模块建立节点与前网络层之间的关联,丰富早期信息,捕捉长期运动关节间的潜在关系,学习更全面的上下文特征.多尺度时间卷积模块执行不同感受野的时间卷积,捕捉运动在时间域上的短期依赖关系和长期依赖关系.在3个基准数据集上的实验表明CFE-GCN性能较优.
2024 Vol. 37 (8): 703-714 [
摘要
] (
280
) [
HTML
1KB] [
PDF
1334KB] (
209
)
论文与报告
715
故事启发大语言模型的时序知识图谱预测
陈娟, 赵新潮, 隋京言, 祁麟, 田辰, 庞亮, 方金云
时序知识图谱海量稀疏,实体的长尾分布导致对分布外实体的推理泛化性较差,历史交互低频导致对未来事件的预测偏差较大.为此,文中提出故事启发大语言模型的时序知识图谱预测方法,利用大语言模型的世界知识储备和复杂语义推理能力,增强对分布外实体的理解和交互稀疏事件的关联.首先,根据时序知识图谱中时间和结构的特性筛选“关键事件树”,通过历史事件筛选策略提炼最具代表性的事件,并摘要当前查询相关的历史信息,减少数据输入量并保留最重要的信息.然后,微调大语言模型生成器,生成时序语义关联且符合逻辑的“关键事件树”叙事故事,作为非结构化输入.在生成过程中,特别关注事件之间的因果关系和时间顺序,确保生成的故事具有连贯性和合理性.最后,利用大语言模型推理器推理缺失的时序实体.在3个公开数据集上的实验表明,文中方法可充分发挥大模型的能力,完成精准的时序实体推理.
2024 Vol. 37 (8): 715-728 [
摘要
] (
187
) [
HTML
1KB] [
PDF
1033KB] (
202
)
研究与应用
729
基于特征空间增强重放和偏差校正的类增量学习方法
孙晓鹏, 余璐, 徐常胜
网络不断学习新的知识时会遭受灾难性遗忘,增量学习方法可通过存储少量旧数据重放以实现增量学习的可塑性与稳定性的平衡.然而,存储旧任务的数据会有内存限制及隐私泄露的问题.针对该问题,文中提出基于特征空间增强重放和偏差校正的类增量学习方法,用于缓解灾难性遗忘.首先,每类存储一个中间层特征均值作为其代表的原型,并冻结低层特征提取网络,避免原型“漂移”.在增量学习阶段,存储的原型通过几何平移变换增强重放的方式维持先前任务的决策边界.然后,通过偏差校正为每个任务学习分类权重,进一步纠正方法分类偏向于新任务的问题.在4个基准数据集上的实验表明文中方法性能较优.
2024 Vol. 37 (8): 729-740 [
摘要
] (
119
) [
HTML
1KB] [
PDF
1031KB] (
166
)
741
基于核极限学习机的多标签数据流半监督在线分类方法
王雨晨, 邱士远, 李培培, 胡学钢
实际应用中涌现的大量流数据具有高速到达、海量、动态变化等特点,同时,这些数据流常含有多个标签且只有少量数据被标记,从而带来多标签数据环境下的概念漂移与标签缺失问题.为此,文中提出基于核极限学习机的多标签数据流半监督在线分类方法.首先,针对多标签数据流的标签缺失问题,根据滑动窗口将数据流划分为
k
块,对每块数据构造特征相似性矩阵和标签相似性矩阵,并加入核极限学习机的训练中.同时为了适应流数据的特点,设计增量式更新机制,构建半监督在线核极限学习机.然后,为了适应数据流中的概念漂移问题,采用基于时间戳丢弃更新的机制,预先设定数据规模,当数据到达指定规模后,丢弃最旧的无标签数据,将新的数据加入更新.最后,在10个多标签数据集上的实验表明,文中方法对标签缺失和概念漂移问题具有较强的适应能力,并能保持较优的分类效果.
2024 Vol. 37 (8): 741-754 [
摘要
] (
143
) [
HTML
1KB] [
PDF
853KB] (
142
)
模式识别与人工智能
主管:中国科学技术协会
主办:中国自动化学会
国家智能计算机研究开发中心
中国科学院合肥智能机械研究所
出版:科学出版社
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由
北京玛格泰克科技发展有限公司
设计开发 技术支持:support@magtech.com.cn