模式识别与人工智能
首 页
期刊简介
编委会
投稿指南
伦理声明
联系我们
 
English
模式识别与人工智能
学术不端论文认定及处理办法
版权转让协议
保密证明
录用稿件电子版要求
修改说明格式
更多....
中国自动化学会
国家智能计算机研发中心
中科院合肥智能机械所
更多....
2023年 36卷 9期 刊出日期 2023-09-25
基于深度学习的模式分类与检测
论文与报告
基于深度学习的模式分类与检测
767
高阶微分方程启发的红外小目标检测网络
张铭津, 臧璠, 岳珂, 许嘉敏, 李云松, 高新波
红外小目标检测广泛应用于红外检测、红外跟踪等诸多实际领域,但红外小目标检测难度较大,现有红外小目标检测方法不能解决复杂背景问题,并且在特征提取中容易丢失细节信息.因此,文中提出高阶微分方程启发的红外小目标检测网络.在可解释的理论指导下设计四阶Adams引导的特征融合模块,引入自适应权重因子,有效融合不同层级的多尺度信息,并将求解的高阶差分方程应用于网络,通过深层次的学习消除冗杂信息.目标特征增强模块使用不同尺度卷积构成的残差结构,旨在对原始特征进行抑制背景噪声和增强信息量大的多尺度特征操作.在公开数据集SIRST上的小目标检测实验表明,文中网络检测结果的多个评估指标值以及视觉效果均较优.
2023 Vol. 36 (9): 767-777 [
摘要
] (
538
) [
HTML
1KB] [
PDF
1792KB] (
786
)
778
模糊逻辑引导的多粒度深度神经网络
周天奕, 丁卫平, 黄嘉爽, 鞠恒荣, 姜舒, 王海鹏
准确识别和分类组织病理图像对于疾病的早期检测和治疗至关重要.病理医生诊断时通常会采用多层次的方式进行判断,即观察各个倍率下细胞的异常区域,然而现有模型通常只能在单一粒度上进行特征提取,忽略细胞的多粒度特性.因此,文中提出模糊逻辑引导的多粒度深度神经网络.首先,针对细胞的构造,在粗粒度、中粒度和细粒度这3个粒度层面上进行多粒度特征提取,充分利用病理组织图像中的信息.同时,针对多粒度特征提取时出现的关键信息冗余问题,引入模糊逻辑理论,设置多个模糊隶属函数,分别描述细胞在不同角度上的特征.然后,通过模糊运算得到模糊通用特征,由此设计模糊逻辑引导的交叉注意力机制模块,实现模糊通用特征对多粒度特征的引导.最后,通过编码器将特征扩散至所有的补丁令牌,获得较好的分类准确性和鲁棒性.实验表明,文中网络在组织病理图像分类上具有较高的准确率.
2023 Vol. 36 (9): 778-792 [
摘要
] (
342
) [
HTML
1KB] [
PDF
2071KB] (
1053
)
793
基于自引导注意力的双模态校准融合目标检测算法
张惊雷, 宫文浩, 贾鑫
为了解决传统双模态目标检测方法难以在复杂场景(如大雾、眩光、黑夜)中克服低对比度噪声以及无法有效识别小尺寸目标的问题,文中提出基于自引导注意力的双模态校准融合目标检测算法.首先,设计双模态融合网络,利用通道特征和空间特征校准纠正输入图像(可见光图像与红外图像)中的低对比度噪声,从纠正后的特征中获取互补信息,并准确实现特征融合,提高算法在眩光、黑夜和大雾等场景下的检测精度.然后,构建自引导注意力机制,捕捉图像像素之间的依赖关系,增强不同尺度特征的融合能力,提高算法对于小尺寸目标的检测精度.最后,在行人、行人车辆、航拍车辆三类六种数据集上进行的大量实验表明,文中算法检测精度较高.
2023 Vol. 36 (9): 793-805 [
摘要
] (
421
) [
HTML
1KB] [
PDF
3392KB] (
805
)
806
时序动作单元感知的开集动作识别
杨凯翔, 高君宇, 冯洋博, 徐常胜
开集动作识别任务要求模型不仅能准确识别训练集中的类别,还能拒绝训练集上未出现的未知类动作.目前,大多数方法都将动作视为一个整体,忽略动作本身可被分解为更细粒度的动作单元.为此,文中提出时序动作单元感知的开集动作识别方法.首先,设计动作单元关系模块,学习细粒度的动作单元特征,得到动作和动作单元的关系模式,并通过已知类动作和未知类动作在动作单元上不同的激活程度识别未知类动作.然后,设计动作单元时序模块,建模动作单元的时序信息,研究动作单元的时序性,进一步区分因为外观相似而被混淆的已知类动作和未知类动作.最后,综合考虑关系模式与动作单元时序信息,使模型具备区分已知类动作和未知类动作的能力.在3个动作识别数据集上的实验表明,文中方法性能较优.
2023 Vol. 36 (9): 806-817 [
摘要
] (
326
) [
HTML
1KB] [
PDF
1350KB] (
697
)
818
基于伪全局Swin Transformer的遥感图像识别算法
王科平, 左鑫浩, 杨艺, 费树岷
如何在多目标并列的情况下,确定符合人类思维习惯的核心目标是遥感图像识别的关键之一.因此,在全局视野下,为各目标分配符合人类视觉习惯的注意力,是甄选核心目标的有效途径之一.文中结合Transformer提取全局特征的思想和Swin Transformer对图像栅格化处理可降低计算量的优点,提出基于伪全局Swin Transformer的遥感图像识别算法.构建伪全局Swin Transformer模块,将遥感图像栅格化后的各局部信息聚合为一个特征值,替代以像素为基础的全局信息,以较小计算量为代价,获取全局特征,有效提升模型对所有目标的感知能力.同时,通过以可变形卷积为基础的感受野自适应缩放模块,使感受野向核心目标偏移,提高网络对核心目标信息的关注,从而实现对遥感图像的精确识别.在RSSCN7、AID和OPTIMAL-31遥感图像数据集上的实验表明,文中算法取得较高的识别精度和参数识别效率.
2023 Vol. 36 (9): 818-831 [
摘要
] (
333
) [
HTML
1KB] [
PDF
5148KB] (
460
)
832
基于变分贝叶斯对比网络的非参数图像聚类方法
张胜杰, 王一飞, 向旺, 薛迪展, 钱胜胜
非参数图像聚类中聚类簇数是未知的,需要模型自动发现.虽然一些现有的贝叶斯方法可以自动推断聚类簇数,但由于计算成本过高或过于依赖已学习到的特征,在大规模图像数据集上并不可行.因此,文中提出基于变分贝叶斯对比网络的非参数图像聚类方法.首先,利用ResNet提取图像特征.然后,提出深度变分迪利克雷过程混合优化方法,自动推断聚类数量,可直接嵌入端到端的深度模型,并可与特征提取器进行联合优化.最后,提出极化对比聚类学习,利用极化标签去噪策略对标签进行去噪和极化处理,并利用极化标签与数据增强预测标签进行对比学习,联合优化图像特征提取器和分类器.在三个基准数据集上的实验表明,文中方法性能较优.
2023 Vol. 36 (9): 832-841 [
摘要
] (
281
) [
HTML
1KB] [
PDF
2016KB] (
735
)
论文与报告
842
基于莫比乌斯陀螺矢量空间的双曲正定核
杨梅梅, 方鹏飞, 朱士鹏, 薛晖
层次结构数据广泛存在于各类机器学习场景中,双曲空间能够以极低的失真编码层次结构数据,引入核方法后,可进一步提高双曲空间的表征能力.然而,现有的双曲核仍然存在自适应能力较低或数据失真的缺陷.为了解决这些问题,文中提出基于莫比乌斯陀螺矢量空间的双曲正定核方法.利用莫比乌斯陀螺矢量空间与庞加莱模型之间的关系,构造莫比乌斯径向基核.具体使用莫比乌斯陀螺距离代替欧几里得距离,构造莫比乌斯高斯核和莫比乌斯拉普拉斯核,并进一步证明核函数的正定性.另外,将该核函数从复空间转换到实空间上,更适用于大多数机器学习任务.在多组真实的社交网络数据集上的实验验证文中方法的有效性.
2023 Vol. 36 (9): 842-855 [
摘要
] (
297
) [
HTML
1KB] [
PDF
822KB] (
339
)
856
基于结构增强的异质数据联邦学习模型正则优化算法
张珉, 梁美玉, 薛哲, 管泽礼, 潘圳辉, 赵泽华
联邦学习中由于不同客户端本地数据分布异质,在本地数据集上训练的客户端模型优化目标与全局模型不一致,导致出现客户端漂移现象,影响全局模型性能.为了解决非独立同分布数据带来的联邦学习模型性能下降甚至发散的问题,文中从本地模型的通用性角度出发,提出基于结构增强的异质数据联邦学习模型正则优化算法.在客户端利用数据分布异质的本地数据进行训练时,以结构化的方式采样子网络,并对客户端本地数据进行数据增强,使用不同的增强数据训练不同的子网络学习增强表示,得到泛化性较强的客户端网络模型,对抗本地数据异质带来的客户端漂移现象,在联邦聚合中得到性能更优的全局模型.在CIFAR-10、CIFAR-100、ImageNet-200数据集上的大量实验表明,文中算法性能较优.
2023 Vol. 36 (9): 856-865 [
摘要
] (
268
) [
HTML
1KB] [
PDF
967KB] (
817
)
模式识别与人工智能
主管:中国科学技术协会
主办:中国自动化学会
国家智能计算机研究开发中心
中国科学院合肥智能机械研究所
出版:科学出版社
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由
北京玛格泰克科技发展有限公司
设计开发 技术支持:support@magtech.com.cn