模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2011年 24卷 4期 刊出日期 2011-08-25

论文与报告
综述与评论
研究与应用
 
论文与报告
457 改进的跨语种语音合成模型自适应方法
刘航,凌震华,郭武,戴礼荣
统计参数语音合成中的跨语种模型自适应主要应用于目标说话人语种与源模型语种不同时,使用目标发音人少量语音数据快速构建具有其音色特征的源模型语种合成系统。本文对传统的基于音素映射和三音素模型的跨语种自适应方法进行改进,一方面通过结合数据挑选的音素映射方法以提高音素映射的可靠性,另一方面引入跨语种的韵律信息映射以弥补原有方法中三音素模型在韵律表征上的不足。在中英文跨语种模型自适应系统上的实验结果表明,改进后系统合成语音的自然度与相似度相对传统方法都有了明显提升。
2011 Vol. 24 (4): 457-463 [摘要] ( 382 ) [HTML 1KB] [PDF 524KB] ( 631 )
464 基于流形学习的三维步态鲁棒识别方法
刘海涛,汪增福,曹洋
针对过去几乎都是在单目视觉的情况下进行步态识别研究的现状,提出一种基于立体视觉的步态识别方法。首先利用立体匹配技术获得人体轮廓的三维信息,并据此构造出三维人体轮廓描述子以获取人体的步态特征。接着通过平滑、去噪等预处理手段抑制噪声的影响,并采用流形学习构建低维流形进行特征降维。最后将最近邻分类器和最近邻模板分类器用于识别过程。采用该方法在PRLABⅡ立体步态数据库和不规则测试数据集ExN上进行实验,获得较高的识别率。实验结果表明,文中所提出的方法具有与行人行走路径到摄像机之间的距离无关的特点,且对于不完整的残缺步态序列、行人行为姿态的变化、携带物品和服饰变化等具有较强的鲁棒性。
2011 Vol. 24 (4): 464-472 [摘要] ( 375 ) [HTML 1KB] [PDF 698KB] ( 786 )
473 基于局部性正则化推广误差界的特征选择算法
薛晖,陈松灿
特征选择是当前模式识别领域的研究热点。滤波方法和封装方法是特征选择算法中评价特征子集的两种主要策略,但均不能保证其后所设计的分类器的推广性能。针对以上两种策略的不足,首先引入基于样本流形结构的局部性正则化推广误差界。并在此基础上,以局部性正则化推广误差界为评价函数,以局部性正则化分类方法为目标分类器,提出一种混合滤波-封装型特征选择算法。该算法既保持了较高的计算效率,又保证了目标分类器良好的推广性。实验结果表明,新算法具有比对比算法更优的分类性能。
2011 Vol. 24 (4): 473-478 [摘要] ( 379 ) [HTML 1KB] [PDF 413KB] ( 638 )
479 基于自适应差分进化算法的多边多议题协商
毕晓君,肖婧
为提高基于智能体(agent)的电子商务多边多议题协商的效率及稳定性,提出改进的自适应差分进化算法(ADE)并将其引入到合作环境下的多边多议题协商问题中。差分进化(DE)算法是目前求解连续空间内全局优化问题性能最优的进化优化算法之一。利用该算法收敛速度快、收敛精度高、全局寻优能力强等特点加快多边多议题协商的速度,使协商效率更高、稳定性更强。通过与目前解决多边多议题协商问题效果最好的混合遗传算法(HGA)对比,实验结果表明,自适应差分进化算法具有更快的收敛速度和更好的稳定性,可以使多边多议题协商中的各智能体达到协商最优解,并有效地减少协商次数,提高协商的效率和稳定性。
2011 Vol. 24 (4): 479-483 [摘要] ( 320 ) [HTML 1KB] [PDF 367KB] ( 598 )
484 对DCT域连续LSB隐写术的提取攻击
陈嘉勇,祝跃飞,张卫明,刘九芬
基于JPEG图像的空域特征,针对DCT域连续LSB隐写术提出一种唯载密提取攻击方法。根据JPEG图像编码块在空域的块不连续性,将嵌入消息起止点估计问题转化为序列突变点的估计问题,建立逼近理想序列模型估计序列突变点。新模型不仅适用于对连续JSteg算法的提取攻击,对一类可抵抗χ2检验攻击的连续JSteg改进算法同样有效。实验结果表明,对消息嵌入起止点的平均估计误差约为260个系数。
2011 Vol. 24 (4): 484-491 [摘要] ( 559 ) [HTML 1KB] [PDF 496KB] ( 645 )
492 一种基于加速度传感器的虚拟手写数字特征提取及识别方法
薛洋,金连文
本文提出了一种基于加速度传感器的虚拟手写数字特征提取及识别方法。该方法首先对书写时产生的三轴加速度信号投影,获得三个二维矢量。然后基于每个二维矢量提取反映加速度信号顺时针和逆时针旋转变化的特征点,并进行数字编码得到旋转特征码。接着采用归一化编辑距离来度量不同样本的旋转特征码间的差异,最后结合旋转特征和基于编辑距离的旋转特征码的距离测度,给出虚拟手写数字识别算法。与传统的时域原始特征、峰值谷值特征、FFT特征的识别性能对比实验表明本文方法的有效性。
2011 Vol. 24 (4): 492-500 [摘要] ( 417 ) [HTML 1KB] [PDF 573KB] ( 902 )
501 一种适用于人脸检测具有强聚类能力的新颜色空间YCH
钟志光
利用肤色信息检测人脸是一种快速而有效的方法,但选取合适的颜色空间是一个十分棘手的问题。文中提出一种自适应颜色空间YCH,将最常用颜色空间的优点融合到一个新的简单的非线性变换,其中所有的变换系数都能根据人脸图像中每个像素自身的特性自动调整,因而可有效消除影响肤色与非肤色分类结果的各种不利因素。实验结果表明提出的颜色空间对各类人脸图像都有很强的聚类能力。
2011 Vol. 24 (4): 501-505 [摘要] ( 334 ) [HTML 1KB] [PDF 316KB] ( 600 )
506 一种交互式动态影响图的改进算法
李波,罗键,尹华一,田乐
交互式动态影响图(I-DIDs)是基于概率图形理论的多智能体动态交互决策的图模型。为缓解该模型状态空间随时间片增加呈指数级增长的趋势,文中基于行为等价的基本思想压缩状态空间,提出构建Epsilon行为等价类的方法:利用有向无环图表示其它Agent可能的信度和行为,把信度在空间上接近的模型聚为一类,实现自顶向下合并行为等价模型。该过程避免求解状态空间中的所有候选模型,节省了存储空间和计算时间。模型实例上的仿真结果显示了该算法的有效性。
2011 Vol. 24 (4): 506-513 [摘要] ( 331 ) [HTML 1KB] [PDF 527KB] ( 586 )
514 熵域流形空间中的目标尺度感知策略
吴克伟,谢昭,高隽
针对场景中不同目标的尺度感知问题,提出一种基于熵度量的场景目标尺度感知计算模型。通过对熵域空间中流形分布的统计特性分析,描述图像流形空间中的目标分布规律,在四叉树金字塔描述的基础上,依据尺度感知评价函数,形成了多目标尺度感知计算过程。实验结果说明,四叉树空间金字塔近似人类视觉感知的层次结构,基于熵域流形空间的目标描述可以有效实现目标尺度感知。
2011 Vol. 24 (4): 514-520 [摘要] ( 335 ) [HTML 1KB] [PDF 471KB] ( 680 )
521 极小树叶结点数定理的补充证明及有关分析
张明亮,吴俊,李凡长
通过对博弈树搜索情形的深入分析,给出极小树叶结点数定理新的完整证明,指出以往证明源于对极小搜索树的认识偏差而不完备。对窗口搜索效率来源的细致分析和实验验证,则揭示出博弈树窗口搜索提高效率的首要原因是窗口位置而不是窗口大小。这一与人们的感性认知不符的定性结论,将有助于人们准确理解和运用有关博弈树搜索算法。
2011 Vol. 24 (4): 521-526 [摘要] ( 279 ) [HTML 1KB] [PDF 466KB] ( 733 )
综述与评论
527 网络数据分类研究进展
熊伟,周水庚,关佶红
各种网络的广泛应用产生了大量的网络数据,对网络数据进行分类是数据挖掘的一个重要问题。文中对网络数据分类的国内外研究进展进行评述。首先概述网络数据分类的基本概念,然后详细分析各种网络数据分类算法,重点讨论在网络标注稀疏情况下的网络数据分类面临的挑战和解决策略,最后对网络数据分类技术进行总结和展望。
2011 Vol. 24 (4): 527-537 [摘要] ( 427 ) [HTML 1KB] [PDF 918KB] ( 714 )
研究与应用
538 一种快速的双目标非支配排序算法
刘敏,曾文华,赵建峰
提出一种快速的双目标非支配排序算法(BNSA)。设计了前向比较操作,以便快速识别非支配个体。提出了按需排序策略,避免生成多余的非支配前沿。论证BNSA算法的正确性,分析其时间复杂度为O(NlogN)。在9个标准的双目标优化测试问题上进行了比较实验。实验结果表明与其它3种非支配排序算法相比,BNSA算法在大多数测试问题上具有更快速的性能。当进化代数超过400代时,BNSA在所有的测试问题上都具有最好的加速效果。此外,BNSA算法简明、易于编程实现,可集成到任何基于非支配排序的多目标进化算法中,能较大程度地提高双目标优化的运行速度。
2011 Vol. 24 (4): 538-547 [摘要] ( 331 ) [HTML 1KB] [PDF 641KB] ( 867 )
548 视觉选择性注意模型化计算中的特征整合权值估计与图像显著性区域提取
刘琼,秦世引
针对视觉选择性注意模型化计算过程中不同特征在整合阶段的权值判定,提出一种基于特征图分布的权值估计方法,并在静态图像显著性区域提取中取得了令人满意的应用效果。首先提取原始图像的颜色、方向和强度特征图像,然后计算各个特征图的广义高斯分布参数与方差,进而给出一种特征图权值估计算法,最后通过对特征图的加权整合与归一化实现对原始图像的显著性区域提取。实验结果表明,通过此方法计算的权值对特征进行加权调制所提取的显著性区域的效果更加符合人眼的观测结果。
2011 Vol. 24 (4): 548-554 [摘要] ( 378 ) [HTML 1KB] [PDF 466KB] ( 926 )
555 基于段匹配差异观察值的HMM在线签名认证方法研究
邹杰,吴仲城
提出一种用签名的分段差异值作为隐马尔可夫模型(HMM)观测值的在线签名认证应用方法。首先,采用双向后向合并DTW算法确定签名中关键点之间的对应关系。然后,采用经典DTW度量签名中各种细微的差异,用这些DTW差异值作为观测值训练HMM模型。将模型状态的意义定义为相似程度,将状态转移结构设定为全概率转移。在SVC2004签名数据库上,验证了该方法的有效性。
2011 Vol. 24 (4): 555-560 [摘要] ( 495 ) [HTML 1KB] [PDF 390KB] ( 752 )
561 基于查询扩展的中文语音高效检索
李伟吴,吕萍
中文语音检索系统用于快速准确地在中文语音文档中定位用户查询。典型实现方案对语音文档进行识别后建立索引,对查询串进行分词并以分词结果检索。检索过程中出现的查询分词与识别结果不匹配将影响系统性能。为解决该问题,产生多种查询分词结果,并对其进行前后缀扩展后检索。为解决因扩展带来的检索内容过多,用时较长的问题,引入有穷自动机压缩扩展,在此基础上设计基于令牌的搜索算法高效检索。实验证明,对查询的多分词与前后缀扩展可以使检索EER相对提升50%~70%,引入FSA可压缩检索空间,使得检索速度提升近30倍。
2011 Vol. 24 (4): 561-566 [摘要] ( 418 ) [HTML 1KB] [PDF 378KB] ( 508 )
567 基于层叠条件随机场的事件因果关系抽取
付剑锋,刘宗田,刘炜,周文
传统的事件因果关系抽取方法只能覆盖文本中的部分显式因果关系。针对这种不足,提出一种基于层叠条件随机场模型的事件因果关系抽取方法。该方法将事件因果关系的抽取问题转化为对事件序列的标注问题,采用层叠(两层)条件随机场标注出事件之间的因果关系。第一层条件随机场模型用于标注事件在因果关系中的语义角色,标注结果传递给第二层条件随机场模型用于识别因果关系的边界。实验表明,本文方法不仅可以覆盖文本中的各类显式因果关系,并且均能取得较好的抽取效果,总体抽取效果的F1值达到85。3%。
2011 Vol. 24 (4): 567-573 [摘要] ( 733 ) [HTML 1KB] [PDF 537KB] ( 986 )
574 基于线性分段与HMM的时间序列分类算法
尹锐,李雄飞,李军,彭宏
抽象出时间序列的多段线性特征,并提出一种时间序列分类算法 。该算法包括3个模块:导数估值函数,线性分段方法,DDHMM模型(基于HMM)。首先,利用导数估值函数与线性分段方法检测多段线性特征,若满足多线段特征,则将时间序列转化为特定结构的观察值序列;然后,利用训练观察值序列训练DDHMM模型,通过比较各模型产生测试观察值序列的概率值进行分类。实验表明,针对满足多段线性特征的时间序列,该算法具有较高的分类精度,应用在UCI数据集和实际工程中,分类效果好。
2011 Vol. 24 (4): 574-581 [摘要] ( 571 ) [HTML 1KB] [PDF 580KB] ( 780 )
582 基于时空分析的视频前景提取
闵华清,陈聪,罗荣华,朱金辉
为了从包含动态背景或者非平移运动前景的视频中提取完整的前景区域,提出一种视频分割算法。首先,将视频中单个像素的变化过程视为离散时间信号,运用时间轴的Gabor滤波对时域信息进行分析,将视频粗分为前景和背景;然后,运用均值漂移算法对前景和背景做颜色聚类分析,分析空域的颜色关联信息,分别建立全局颜色模型和局部颜色模型;最后,运用双重标记法提取视频前景。该算法综合考虑视频的时域信息和空域信息。在多个视频库的测试结果表明,该算法可以显著提高前景区域提取的精度,特别是对于背景动态变化或者前景发生非平移运动的视频。
2011 Vol. 24 (4): 582-590 [摘要] ( 431 ) [HTML 1KB] [PDF 558KB] ( 682 )
591 一种融入可信度的集成SVM垃圾书签检测方法
张付志,周全强
针对现有垃圾书签检测方法在用户概貌信息较少情况下检测性能下降的问题,提出一种融入可信度的集成SVM垃圾书签检测方法。首先基于Bootstrap技术对训练样本进行可重复采样,得到个体SVM的训练子集,然后将SVM的标准输出直接拟合Sigmoid函数得到SVM的后验概率输出,作为类别输出的可信度,并提出一种性能优于投票策略的融入可信度的融合方法对个体SVM的输出结果进行融合。实验结果表明,该方法在用户概貌信息较少的情况下具有较好的检测性能。
2011 Vol. 24 (4): 591-600 [摘要] ( 436 ) [HTML 1KB] [PDF 402KB] ( 651 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn