模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2024年 37卷 1期 刊出日期 2024-01-25

主编寄语
论文与报告
研究与应用
 
主编寄语
0 主编寄语
郑南宁
2024 Vol. 37 (1): 0-0 [摘要] ( 105 ) [HTML 1KB] [PDF 181KB] ( 288 )
论文与报告
1 基于三路径网络的医学图像分割方法
蒋清婷, 叶海良, 曹飞龙
卷积神经网络由于强大的特征提取能力在医学图像分割任务上取得一定进展,但仍需提升边缘分割的准确性.为此,文中提出基于边缘选择图推理的三路径网络,包括目标定位路径、边缘选择路径和细化路径.在目标定位路径中,设计多尺度特征融合模块,聚合高级特征,实现病变区域的定位.在边缘选择路径中,构造边缘选择图推理模块,用于低级特征的边缘筛选,并进行图推理,保证病变区域的边缘形状.在细化路径中,建立渐进式组级细化模块,逐步细化不同尺度特征的结构信息与细节信息.此外,引入融合加权Focal Tversky 损失和加权交并比损失的复合损失,减轻类不平衡的影响.在公开数据集上的实验表明,文中方法性能较优.
2024 Vol. 37 (1): 1-12 [摘要] ( 277 ) [HTML 1KB] [PDF 1462KB] ( 460 )
13 面向序列诊断的强化计算机自适应测验方法
刘子瑞, 吴金泽, 姚方舟, 刘淇, 陈恩红, 沙晶, 王士进, 苏喻
计算机自适应测验旨在根据学生历史表现为学生选择合适的题目,快速有效地测量学生的真实能力.然而在智能教育场景下,现有自适应测验策略仍存在目标复杂和知识稀疏等问题.为此,文中构建用于智能场景的可精准测评学生知识能力的面向序列诊断的强化计算机自适应测验方法,包括基于序列诊断的学生模拟器和学生画像模型,并针对真实场景中自适应测验的目标复杂性,设计薄弱点准确率、预测表现耦合、自适应测验时长、测验异常率和测验的难度结构这5个评价指标.进一步地,提出基于强化学习的计算机自适应测验选题策略,利用双通道自注意力学习及矛盾学习模块缓解知识稀疏的问题.真实数据上的实验表明,文中选题策略不仅可高效测量学生真实能力,还可优化学生的作答体验,同时选择的题目也具有一定的可解释性,从而为智能教育场景下的计算机自适应测验提供一个可行方案.
2024 Vol. 37 (1): 13-26 [摘要] ( 134 ) [HTML 1KB] [PDF 1169KB] ( 327 )
27 支持亿级数据的高效密文范围查询完整性验证
王肇康, 潘佳辉, 周璐
密文查询的完整性验证机制能在保护人工智能应用数据隐私的同时,为查询结果的可靠性提供保证.然而,现有针对密文范围查询的完整性验证方法存在验证数据结构构建开销较高、数据可扩展性较差的缺陷.为此,文中分析ServeDB(Secure Verifiable and Efficient Framework)计算性能瓶颈产生的原因,并基于分析结论提出基于立方格索引的密文范围查询完整性验证方法(Cube-Cell-Based Authentication Tree, CubeTree).CubeTree采用基于分位数归一化的数据重分布优化方法,平衡数据记录在值域空间中的分布,降低数据记录的编码开销.进一步提出基于平衡K叉树的扁平化结构以及基于立方格索引的验证数据结构,合并具有相同编码的数据记录,采用立方格作为基本验证单元,大幅降低验证数据结构的冗余性,减少构造过程的计算与存储开销.在真实数据集与合成数据集上的实验表明,CubeTree能显著降低验证数据结构的构建开销以及查询完整性证明的生成与校验开销,并可高效处理亿级规模的大型数据集.
2024 Vol. 37 (1): 27-46 [摘要] ( 101 ) [HTML 1KB] [PDF 1556KB] ( 255 )
研究与应用
47 基于“人-机-环”信息流的机器人手术系统研究与展望
崔皓鑫, 王嵘, 郑楠, 章颂, 任瞳, 梁渝靖

机器人手术系统凭借微创、精细、灵活、无震颤等优势,在多个外科领域不断得到普及应用.然而,现有的机器人手术系统尚未充分发挥人和机器各自的优势,在智能化交互方面的表现有待提高.因此,文中首先从系统科学的角度分析机器人手术系统中交互关系的发展,并从多方面提出当前人机交互的不足.然后,构建面向机器人手术系统的“人-机-环”信息流框架,以机器人辅助乳内动脉获取手术场景为例,梳理“人-机-环”各部分之间的复杂交互.最后,基于“人-机结合”理论,结合构建的“人-机-环”信息流框架,提出以“人机融合智能共进”为目标的新一代机器人手术系统的设计思路,为实现更安全高效的机器人微创外科手术目标提供借鉴.

2024 Vol. 37 (1): 47-57 [摘要] ( 97 ) [HTML 1KB] [PDF 1516KB] ( 352 )
58 基于融合Lasso的非参数加性分位数回归模型
付漫侠, 周水生
加性分位数回归为非线性关系的建模提供一种灵活、鲁棒的方法.拟合加性分位数模型的方法通常使用样条函数逼近分量,但需要先验的选择节点,计算速度较慢,并不适合大规模数据问题.因此文中提出基于融合Lasso的非参数加性分位数回归模型(Nonparametric Additive Quantile Regression Model Based on Fused Lasso, AQFL),是在融合Lasso罚和l2罚之间折衷的可对加性分位数回归模型进行估计和变量选择的模型.融合Lasso罚使模型能快速计算,并在局部进行自适应,从而实现对所需分位数甚至极端分位数的预测.同时结合l2罚,在高维数据中将对响应影响较小的协变量函数值压缩为零,实现变量的选择.此外,文中给出保证收敛到全局最优的块坐标ADMM算法(Block Coordinate Alternating Direction Method of Multipliers, BC-ADMM),证明AQFL的预测一致性.在合成数据和碎猪肉数据上的实验表明AQFL在预测准确性和鲁棒性等方面较优.
2024 Vol. 37 (1): 58-72 [摘要] ( 91 ) [HTML 1KB] [PDF 764KB] ( 260 )
73 基于多重视觉注意力的唇语识别
谢胤岑, 薛峰, 曹明伟
唇语识别是将单个说话人嘴唇运动的无声视频翻译成文字的一种技术.由于嘴唇运动幅度较小,现有唇语识别方法的特征区分能力和泛化能力都较差.针对该问题,文中分别从时间、空间和通道三个维度研究唇语视觉特征的提纯问题,提出基于多重视觉注意力的唇语识别方法(Lipreading Based on Multiple Visual Attention Network, LipMVA).首先利用通道注意力自适应校准通道级别的特征,减轻无意义通道的干扰.然后使用两种粒度不同的时空注意力,抑制不重要的像素或帧的影响.CMLR、GRID数据集上的实验表明LipMVA可降低识别错误率,由此验证方法的有效性.
2024 Vol. 37 (1): 73-84 [摘要] ( 180 ) [HTML 1KB] [PDF 2836KB] ( 419 )
85 基于对比优化的多输入融合拼写纠错模型
伍瑶瑶, 黄瑞章, 白瑞娜, 曹军航, 赵建辉
文本编辑工作中,中文拼写纠错必不可少.现有中文拼写纠错模型大多为单输入模型,语义信息和纠错结果存在局限性.因此,文中提出基于对比优化的多输入融合拼写纠错模型,包含多输入语义学习阶段和对比学习驱动的语义融合纠错阶段.第一阶段集成多个单模型的初步纠错结果,为语义融合提供充分的互补语义信息.第二阶段基于对比学习方法优化多个互补的句子语义,避免模型过度纠正句子,同时融合多个互补语义对错误句子进行再纠错,改善模型纠错结果的局限性.在SIGHAN13、SIGHAN14、SIGHAN15数据集上的实验表明文中方法可有效提升纠错性能.
2024 Vol. 37 (1): 85-94 [摘要] ( 119 ) [HTML 1KB] [PDF 835KB] ( 292 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn