点云异常检测旨在从整体数据分布中识别缺陷样本,并进一步定位其在空间中偏离预期模式的异常区域.针对现有全局匹配策略难以有效捕捉集中于局部细微几何结构异常的问题,文中提出基于局部感知图重构的点云异常检测网络.首先,将点云建模为图结构,通过局部敏感的边卷积操作挖掘点云的局部结构特征,提升对局部细微异常的识别能力.然后,基于子图结构对齐策略设计局部对齐重建损失,从结构层面放大正常样本与异常样本间的差异性.此外,引入局部异常生成策略,构建异常-正常样本对,约束网络学习异常样本向正常样本的模式映射.最后,采用局部匹配检测算法计算异常样本与期望正常样本之间的差异,实现对点云异常区域的检测.实验表明,文中网络显著增强对局部细节的感知能力,在多个类别的点云异常检测任务中均取得较优性能.
脑电情绪识别因其在心理健康监测、脑机交互等领域的广泛应用而备受关注.然而,现有方法仍面临电极空间信息利用不足、标注数据稀缺及跨域分布偏移等问题.为此,文中提出不确定性原型学习的跨域情绪识别方法.首先,设计位置编码引导的跨域图半监督学习模块,引入正余弦位置编码,将电极的空间拓扑结构嵌入邻接矩阵,突破传统方法仅依赖物理距离构建图结构的局限,有效融入符合脑电生理特性的空间先验知识.在此基础上,利用图结构的特征传播机制,协同挖掘标注样本与未标注样本中的深层拓扑表示,缓解标签稀缺带来的训练困难.然后,构建不确定性原型学习模块,量化样本特征的可靠性,动态优化各类别的情感原型,抑制噪声干扰与域间分布偏移,增强方法在不同域间的泛化能力.在多个公开脑电情绪数据集上的实验表明,文中方法在跨域识别任务中性能较优.
工业外观异常检测在智能制造与品质管控中具有重要意义,但受限于异常样本稀缺和分布多样化,现有方法在多类别场景中容易出现重建失真或特征混淆,导致异常定位不准确.为此,文中提出基于偏差扩散与双流对比学习的工业异常检测方法,在潜在空间中通过偏差扩散模型直接学习从含噪特征到正常特征的“偏离方向”,结合类别嵌入捕获特定类别的正常结构,并在推理中融合潜在空间域与图像域差异,生成鲁棒的异常热力图.同时,引入双流对比学习,拉大正常样本与异常样本的间隔.设计前景感知的异常合成策略,构造结构性与纹理性的互补异常,为“正常流-合成异常流”的对比学习提供高质量异常样本.在MVTec-AD、VisA数据集上的实验表明,文中方法在图像级和像素级多项指标上均较优,表现出较强的泛化能力.
针对以压缩-激励(Squeeze-and-Excitation, SE)注意力模块为主要组成的图像超分辨率网络A2F-SD的注意力机制过于简单和多路信息利用能力的不足,文中提出基于四路多尺度注意力模块及桥连结构的轻量级单图超分辨率网络(Lightweight Single-Image Super-Resolution Network Based on Four-Path Multi-scale Attention and Bridge Structure, A2F-MSAB),主要优化A2F中的SE注意力模块与沙漏型结构.首先,设计多尺度自学习融合均值与方差的注意力模块,分成四路增强网络对图像特征的提取能力.然后,将A2F-SD中的沙漏型结构改为桥连多级沙漏型结构,促进网络不同模块之间、浅层与深层之间的信息流动,增强对中高频细节的重建能力.实验表明,A2F-MSAB性能较优,在部分数据集上的指标值甚至优于A2F-SD及A2F-S.
现有行人搜索方法普遍局限于图像查询,当查询图像质量不佳或行人特征不完整时,检索准确性显著降低.此外,主流方法依赖区域提案网络和非极大抑制生成预定义候选框,难以实现查询到全景图库的端到端行人搜索.因此,文中提出多模态查询引导的端到端行人搜索方法,引入行人的文本描述作为辅助模态,弥补单一视觉信息的不足,并通过端到端架构联合优化行人检测和重识别任务.首先,挖掘查询图像与文本描述的差异化语义信息,学习更全面的行人信息,提升行人表征的语义完整性.然后,利用跨模态注意力机制,增强全景图像上与查询信息对应的行人特征,提升对行人特征的判别能力.最后,采用基于Transformer的检测模块,摒弃传统区域提案网络和非极大抑制流程,直接输出行人搜索结果.在具有挑战性的数据集上的实验表明,文中方法性能较优,由此验证方法的有效性.
针对现有微表情识别方法存在多尺度特征提取能力不足、区域协同关系建模不充分及计算复杂度较高等缺点,提出结合空间通道特征与图注意力的分层Transformer微表情识别方法(Hierarchical Transformer for Micro-Expression Recognition with Spatial-Channel Features and Graph Attention, HT-SCGA).首先,设计多尺度动态窗口模块,通过自适应窗口扩展实现从局部到全局的特征层次化提取.然后,设计双域特征关联模块,在空间维度与通道维度建模细粒度依赖关系,有效提升特征表达能力并降低计算复杂度.最后,构建图注意力聚合模块,显式建模面部关键区域间的语义依赖,增强面部动作单元的联动特征.在多个数据集上的实验表明,HT-SCGA性能较优,由此表明其在微表情识别任务中的有效性与高效性.
针对无人机航拍图像中小目标高度密集、遮挡严重及现有通用检测模型计算复杂度较高的问题,文中提出面向无人机图像小目标检测的轻量化异构协同主干双路桥接网络(Lightweight Heterogeneous Collaborative Dual-Path Bridged Network for Small-Target Detection in UAV Images, LHCB-Net).基于YOLOv9框架,通过解耦功能同质化堆叠和感受野受限的RepNCSPELAN4,构建由Repvcblock与Galsk(Global Attention Large Selective Kernel Module, Galsk)协同组成的主干网络,从而集成通道、空间及全局上下文三维注意力机制,有效增强小目标的感知能力.Galsk融合全局建模与前馈强化机制,提升复杂背景与遮挡场景下的特征提取能力,弥补轻量化设计带来的感受野缩减问题.同时通过跨层桥接,将次主干特征直连检测头,实现多尺度特征融合与定位精度优化.此外,引入尺度自适应交并比损失函数,动态调整不同尺度目标的回归权重.在VisDrone2019、UAVDT及自建数据集上的实验表明,LHCB-Net在降低参数与计算量的同时提升对密集小目标的检测性能,可为无人机实时机载检测提供高效解决方案.完整代码发布网址:https://github.com/tson122556/LHCB-Net/tree/master.