2026年, 第39卷, 第3期 刊出日期:2026-03-25
  
    论文与报告
  • 郭芮利, 张清华, 杨莹, 程云龙, 钟杭
    2026, 39(3): 193-207.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    现有多尺度决策系统大多基于Pawlak粗糙集构建,对噪声数据的容错能力有限.尽管引入可变精度以增强不确定环境下的适应性,但现有方法通常先进行尺度选择再进行属性约简,难以充分发挥属性约简在降低计算复杂度方面的作用.同时,信息熵在可变精度多尺度粗糙集模型中对不确定性关系的刻画仍有进一步的拓展空间.针对上述问题,文中提出基于可变精度熵的属性约简与最优尺度组合选择方法.首先,提出单调的可变精度互补条件熵,刻画任意尺度组合下条件属性与决策属性之间的不确定性关系,并据此提出协调的属性约简方法,在保证决策信息不丢失的前提下有效消除冗余属性.然后,为了增强约简结果在分类任务中的有效性,提出基于分类性能的最优属性约简方法.在此基础上,进一步结合约简结果,设计最优尺度组合选择算法,有效降低尺度搜索空间.在UCI 数据集上的实验表明文中方法在分类性能和鲁棒性上的有效性.

  • 王鸿杰, 阴爱英, 叶成龙, 吴运兵
    2026, 39(3): 208-224.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    共情回复生成旨在生成能理解用户情感并做出恰当回应的答复.现有方法较少考虑人格特征对共情表达方式的影响,容易导致回复风格单一、个性化不足.为了解决该问题,文中提出融合人格特征的共情回复生成模型.首先,为了有效利用人格信息,设计人格增强编码模块,获取对话双方的人格特征并进行独立适配与风格化处理.然后,构建迭代推理与人格调制模块,深化情境理解,同时根据对话双方的人格特征,动态计算人格在当前情境中的影响强度,据此调整回复的情感倾向与语言风格.同时,结合情绪预测模块,精准感知用户的潜在情感.最后,在个性化门控解码模块中,通过门控整合机制有效融合情境、情绪、知识与人格信息,生成符合个体特质且具备深度共情能力的回复.在公开数据集上的实验表明文中模型的多个指标值较优.

  • 严唯书, 袁健, 杨明睿, 许嘉汇
    2026, 39(3): 225-238.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    小样本点云语义分割在全局上下文建模、特征对齐及语义引导方面存在不足,难以应对结构复杂、语义模糊及噪声干扰等场景.因此,文中提出面向小样本3D点云语义分割的多层次全局感知模型,基于多层窗口划分,逐步扩展感受野,实现局部几何与全局语义协同建模.设计双域注意力融合模块,结合通道注意力与点域注意力,融合局部信息与全局信息.构建全局辅助点机制,在关键层嵌入可学习的全局点,增强跨层特征传递功能.设计全局类别感知损失,在点级监督上增加类别分布约束,突出小类别目标.消融实验验证各模块的有效性和互补性,对比实验表明文中模型性能较优,尤其在复杂场景中表现出色.

  • 研究与应用
  • 谢涛, 袁玉轩, 左旺孟, 李瑞峰, 赵立军
    2026, 39(3): 239-249.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    基于多模态大语言模型的生成式指代分割方法缺乏对生成质量提升途径的深层探索,受限于监督微调的模仿机制,在复杂场景中面临语义定位偏差与掩码边界粗糙的挑战.为此,文中提出面向生成式视觉感知的细粒度直接偏好对齐框架(Fine-Grained Direct Preference Alignment Method for Generative Visual Perception, FG-DPA),将DPO(Direct Preference Optimization)从文本领域迁移至像素级分割任务中,构建高-低质量的掩码偏好对,引导方法在隐空间学习精准的视觉表征.利用SAM(Segment Anything Model)的交互特性构建两类负样本:为了解决边缘不精细问题,在真值包围盒内引入对抗性点提示,生成局部缺失或溢出的低质量掩码作为边缘负例;为了解决目标定位错误问题,在背景区域随机采样生成非重叠掩码,构建语义级定位负例.经过多样本偏好对的训练,结合SAM实现高精度的掩码分割.在多个数据集上实验表明,FG-DPA可有效抑制定位幻觉,显著提升掩码生成的完整性与边缘准确度,在提升多模态生成式视觉感知性能方面是有效的.

  • 邓大勇, 许捷, 邓志轩, 郑忠龙, 李天瑞
    2026, 39(3): 250-260.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    标记分布学习现已广泛应用于标签歧义处理,但大部分算法难以从特征交互中提取足够的特征交互信息.针对此问题,文中提出基于模糊邻域粗糙集和特征交互的标记分布特征选择算法,从特征交互中提取较多的交互信息.首先,引入模糊依赖关系,度量特征与标签的相关性,重新定义特征间的相关性,同时定义模糊邻域熵,量化特征之间的交互信息.然后,构造基于特征交互信息的特征交互评价指数,结合动态加权函数,计算特征的重要性.在14个LDL的真实世界数据集上的实验表明,文中算法性能较优.

  • 张慧立, 苏如祺, 朱松豪, 梁志伟
    2026, 39(3): 261-277.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    针对无人机航拍、低光照、雾天等复杂跨域场景中目标检测精度较低、背景干扰较强及难样本挖掘不足等问题,文中提出融合异构注意力与拓扑知识扩散的跨域目标检测方法.首先,设计动态融合特征增强模块,通过双路异构注意力机制捕获空间多粒度信息和通道多粒度信息,筛选高迁移性特征,抑制背景噪声.然后,设计类别感知拓扑知识扩散模块,构建全局拓扑结构矩阵.同时引入哈密顿图论,构建类别原型记忆库,通过类内紧致性与类间分离性约束跨域对齐语义关系.最后,设计空间感知难样本挖掘模块,通过置信度-几何-特征三级筛选机制优化难样本权重,缓解前景-背景失衡问题,提升难样本检测能力.在4个数据集上的实验表明,文中方法性能较优,尤其在小目标检测和大目标检测上表现突出.可视化热力图进一步证实方法对复杂场景的特征聚焦能,广泛的消融实验也验证各模块的必要性.

  • 杨泽存, 赵纪元, 赵雨晨, 李忠豪, 卓鹏涛
    2026, 39(3): 278-288.    摘要 ( )  |   PDF全文 ( )   |   HTML ( )

    开放词汇3D可供性检测作为连接高层语义理解与底层机器人操作的关键纽带,旨在赋予具身智能体在非结构化环境中响应自然语言指令并精准定位物体功能区域的能力.然而,现有方法多依赖冻结的预训练视觉-语言模型进行浅层特征匹配,面临文本指令语义歧义性与特征空间几何-语义错位的双重挑战,导致模型泛化性不足.为此,文中提出基于协同语义与几何增强的可供性学习网络(Synergistic Semantic and Geometric Enhancement Based Affordance Learning Network, SSGE-Net).首先,构建物理感知语义增强模块,生成包含几何约束、功能描述及交互逻辑的结构化三元组,实现语义致密化,弥补指令信息的缺失.然后,设计多尺度几何感知细化模块,利用局部动态图卷积与全局自注意力机制捕获互补的拓扑细节,增强几何特征的判别力.最后,提出基于Transformer解码器的深度跨模态对齐模块,利用交叉注意力,根据文本指令动态重构点云特征,实现语义引导下的精准锚定.在3D AffordanceNet数据集上的广泛实验表明,SSGE-Net在全视图任务及部分视图任务上性能均有一定提升,验证其在复杂视点及长尾类别场景中的优越性与鲁棒性.