模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2012年 25卷 1期 刊出日期 2012-02-25

论文与报告
综述与评论
研究与应用
 
论文与报告
1 基于“原型”的机器人开放式室内场所感知算法
朱博,戴先中,李新德

随着现代开放式室内设计理念的流行,一些功能场所逐渐转变为开放或半开放式,对这类场所的认知成为服务机器人面临的新挑战。文中提出一种基于认知心理学原型理论的算法来提高机器人对开放式室内场所的认知能力。首先,设计场所概念的原型模型,主要包括场所概念的特征物品描述和物品间典型空间关系描述。然后提出一种相似性度量函数及一种空间关系评分准则,将两者用于度量当前环境与场所概念原型的相似程度。最后,讨论场所区域感知问题及区域交叠对场所概念感知的影响。仿真实验表明,该算法能够解决对开放式室内场所的感知,具有一定灵活性和鲁棒性。

2012 Vol. 25 (1): 1-10 [摘要] ( 689 ) [HTML 1KB] [PDF 662KB] ( 521 )
11 一种半球面方位关系表示模型
欧阳继红,刘玉峰

提出一种表达半球面方位关系的模型——最小边界扇区模型(MBS),将半球面上区域自上而下正投影到底面,且根据参考对象在底面的投影位置,将投影面划分为12个原子区域。根据研究区域占原子区域的个数等信息来刻画区域间方位关系,不但可表达出左右等方位关系,还可通过区域上点到中心的距离关系定性表达半球面上区域的高度关系等信息。给出MBS模型中可能存在的1932种情形。为进一步研究MBS模型下的推理及复合表的构造,给出此模型下的关系矩阵表示方法,通过此关系矩阵亦可方便推知原半球面上区域间的方位关系。

2012 Vol. 25 (1): 11-15 [摘要] ( 500 ) [HTML 1KB] [PDF 272KB] ( 418 )
16 基于微多普勒信号三维形状特征的人体目标动作分类方法
陈亦望,张品,傅强
从三维形状分析的角度研究基于微多普勒特征的人体目标动作分类。为了从人体运动目标的多普勒频移中获取人体姿态、动作信息,将人体动作多普勒信号经短时傅立叶变换后获得的时间、频率和功率三维信息图形作为研究对象,并分析使用点描述算法获取三维形状特征用于分类的可行性。使用多普勒雷达实测20组人体目标的4个不同动作,采用依赖训练数据的迭代超核函数支持向量机对动作特征学习,应用决策树理论进行分类。研究支持向量机核函数的改进。通过实验证明三维信息的实用性以及分类方法的有效性。
2012 Vol. 25 (1): 16-22 [摘要] ( 637 ) [HTML 1KB] [PDF 490KB] ( 689 )
23 PHOG特征与聚类特征选择的笑脸识别方法
郭礼华,白洋,金连文
基于Gabor特征的人脸表情识别系统虽具有良好的识别性能,但特征维数大、分类器复杂度高。因此,文中提出一种基于PHOG特征与聚类线性鉴别分析(CLDA)的笑脸识别方法。PHOG特征的引入在于简化系统的运算复杂度,而CLDA克服传统线性鉴别分析方法的多模态问题。实验结果表明PHOG特征免去Gabor特征在Adaboost耗时的特征选择过程,具有和Gabor特征相当或更优的识别性能,且CLDA在维数降低时,系统的识别率能得到更好保持。
2012 Vol. 25 (1): 23-28 [摘要] ( 627 ) [HTML 1KB] [PDF 406KB] ( 675 )
29 基于小脑-基底神经节机理的行为认知计算模型
陈静,阮晓钢,戴丽珍
针对智能体的行为认知问题,提出一种小脑与基底神经节相互协调的行为认知计算模型。该模型核心为操作条件学习算法,包括评价机制、行为选择机制、取向机制及小脑与基底神经节的协调机制。初期的学习信号来自于下橄榄体和黑质两部分,在熵的意义上说明该算法是收敛的。采用该学习方法为自平衡两轮机器人建立运动神经认知系统,利用RBF网络逼近行为和评价网络。仿真实验表明该方法改善仅有基底神经节作用的行为-评价算法学习速度慢和失败次数多的问题,学习后期通过温度的不断降低,加快学习速度,震荡逐渐消失,改善学习效果。
2012 Vol. 25 (1): 29-36 [摘要] ( 509 ) [HTML 1KB] [PDF 517KB] ( 914 )
37 基于危险理论的动态约束免疫优化
张著洪
基于危险理论,探讨求解动态约束单目标函数优化的免疫算法。设计的关键在于依据抗原呈递细胞(APC)被感染或凋亡细胞识别的机理,研究监测环境变化和确定环境等级的环境检测模块,以及探寻以自反应群、效应群和环境记忆群为载体的协同进化方案。该算法具有结构简单灵活、寻优时间可动态调节的优点,可实时监测环境变化。比较性的数值实验结果显示,算法在执行效率、效果之间能达到合理权衡且具有明显优越性,对动态约束优化具有较好应用潜力。
2012 Vol. 25 (1): 37-44 [摘要] ( 543 ) [HTML 1KB] [PDF 525KB] ( 722 )
45 一种基于局部描述符的三维人脸识别方法
徐俊,达飞鹏
提出一种局部描述符进行三维人脸识别。每个采样点的局部特征定义为该点根据其法向量与3个主轴之间的角度自适应选取的邻域点集向人脸主轴平面投影所得的面积。文中提出的三维人脸识别算法首先对人脸进行预处理,归一化到较统一的姿态后,提取与鼻尖等距的轮廓线,并对轮廓线进行重采样以剔除无用点。然后对每个采样点提取局部特征。最后建立人脸之间的点对应关系,将加权融合后的局部特征用于识别。通过实验认证,文中方法识别效果较好,且对遮挡和噪声有较好的鲁棒性。
2012 Vol. 25 (1): 45-53 [摘要] ( 617 ) [HTML 1KB] [PDF 626KB] ( 17990 )
54 模糊形态学双向联想记忆网络的性质
曾水玲,徐蔚鸿,杨静宇
为模糊形态学双向联想记忆网络(FMBAM)提出一个学习算法。在理论上证明只要存在使给定的模式对集合成为FMBAM的平衡态集合,则该学习算法总能计算出相应的最大连接权矩阵对。该最大连接权矩阵对能使FMBAM对任意输入在一步内就进入平衡态,并且神经网络全局收敛到平衡态。FMBAM的每个平衡态都是Lyapunov稳定的。当训练模式存在摄动时,利用该学习算法训练的FMBAM,对训练模式摄动拥有好的鲁棒性。
2012 Vol. 25 (1): 54-62 [摘要] ( 675 ) [HTML 1KB] [PDF 473KB] ( 446 )
63 基于核聚类进化算法的音乐情感模糊计算模型
吕兰兰,周昌乐
音乐情感计算涉及到多维度多层次结构的复杂情感表征问题,而情感本身所具有的模糊性、细微性和多样性,使得传统的情感识别方法普遍效率低下且正确率不高。为提高识别精度,首先利用高斯径向基函数进行非线性映射,来分辨、提取并放大更多的细节信息。然后通过深入剖析中国古琴乐曲,从中抽取出影响最大的六个情感特征值,并在非线性映射的基础上,构造一种基于核聚类进化算法的音乐情感模糊计算模型。在此基础上,进一步针对算法中统一设定簇半径阈值的不足,提出基于蚁群算法的规则调整策略,并进行系统实验。实验结果表明,与基于概率统计的Beyes分类方法相比,优化后的模糊计算模型具有较好的识别效果。
2012 Vol. 25 (1): 63-70 [摘要] ( 601 ) [HTML 1KB] [PDF 477KB] ( 569 )
综述与评论
71 行人步态的特征表达及识别综述
贲晛烨,徐森,王科俊,
从人体测量学数据、空间时间数据、运动学数据、动力学数据和视频流数据的特有方法总结步态识别的各种方法。对视频流的方法做了更为详尽的分析,特别是对类能量图法中各种方法的表达式和含义、蕴含的信息是静态还是动态、时变特性进行对比研究。综述步态自身的多种特征融合的识别方法、步态与其它的生物特征融合的识别方法以及“扩展的”步态识别等方面的研究现状,给出现有步态识别研究的评估方法,指出未来步态识别的研究方向。
2012 Vol. 25 (1): 71-81 [摘要] ( 855 ) [HTML 1KB] [PDF 788KB] ( 1713 )
研究与应用
82 一种基于环间面积比的旋转、平移和缩放不变性描述符
王晓年,邱立可,程宇,蒋平,朱劲
提出一种具有旋转、平移、缩放和镜像不变性的描述符。该描述符通过对二值化图像在空间上的划分,以对象在每个环内的分布为特征。首先证明所定义的描述符具有四个不变性,然后用提出的特征完成手势的识别。通过实验表明,当待识别对象存在一定形变时,该描述符仍能够较好地完成匹配,且准确率高于其它算法,表明该特征的鲁棒性。另外,基于对象空间分布的概念可拓展到其它应用中,如计算环内的Hu矩、曲线能量,甚至链码和傅里叶描述子等从而形成新的特征。
2012 Vol. 25 (1): 82-88 [摘要] ( 468 ) [HTML 1KB] [PDF 905KB] ( 866 )
96 信息熵最小约简问题的若干随机优化算法
马胜蓝,叶东毅
现有的启发式属性约简算法一般无法得到信息熵意义下的最小属性约简。为此,文中探讨应用随机优化算法计算信息熵意义下最小属性约简的问题。首先通过定义适当的适应值函数,将信息熵意义下的最小属性约简问题转化为不含约束的适应值优化问题,证明问题转化的等价性。研究基于遗传算法、粒子群优化算法、禁忌搜索以及蚁群算法等若干随机优化算法的求解效率和求解质量,并用一批UCI数据集来加以测试。实验结果表明,文中设计的带增强策略的基于全息粒子群的属性约简算法,具有较高的获得信息熵意义下最小属性约简的概率和较优的算法性能。关键词随机优化算法,粗糙集,信息熵,最小属性约简,全息粒子群中图法分类号TP181ResearchonComputingMinimumEntropyBasedAttributeReductionviaStochasticOptimizationAlgorithmsMASheng-Lan,YEDong-Yi(CollegeofMathematicsandComputerScience,FuzhouUniversity,Fuzhou350108)ABSTRACTExistingheuristicattributereductionalgorithmsgenerallyfailtogetaminimumentropy-basedattributereductionofadecisiontable。Somestochasticoptimizationalgorithmsarediscussedtosolvetheproblemofentropy-basedattributereduction。Firstly,aproperfitnessfunctionisdefinedtotransformtheminimumattributereductionproblemintoafitnessoptimizationproblemwithoutadditionalconstraintsandtheequivalenceoftransformationisproved。Then,thesolvingefficiencyandthesolutionqualityofsomestochasticoptimizationalgorithmsarestudiedsuchasGeneticAlgorithm,ParticleSwarmOptimization,TabusearchandAntColonyOptimization。SomeUCIdatasetsareappliedtotestthoseperformances。TheexperimentalresultsshowthatthefullyinformedPSObasedattributereductionalgorithmwithrefineschemehasahigherprobabilitytofindaminimumentropy-basedattributereductionandgoodperformance。
2012 Vol. 25 (1): 96-104 [摘要] ( 695 ) [HTML 1KB] [PDF 523KB] ( 491 )
105 基于音素识别的语种辨识方法中的因子分析
仲海兵,宋彦,戴礼荣
在基于音素识别的语种辨识系统中,特定的一段语音,音素识别的结果会受到说话人和信道等干扰因素的影响。对此,文中基于音素搭配关系对每段语音构建相应的特征向量表示。在向量空间中,利用因子分析建立噪声子空间的数学描述模型,并在语言模型的训练和识别过程加以消除。在NISTLRE2007的测试任务中,相对于基于音素识别的语种辨识基线系统,该方法可有效提高系统性能。在30s时长测试中,基于音素识别的语言模型和基于音素识别的支持向量机模型的等错误率分别相对降低14。4%和12。9%。
2012 Vol. 25 (1): 105-110 [摘要] ( 701 ) [HTML 1KB] [PDF 403KB] ( 552 )
111 基于半监督学习的增量图像分类方法
梁鹏,黎绍发,覃姜维,罗剑高
为有效使用大量未标注的图像进行分类,提出一种基于半监督学习的图像分类方法。通过共同的隐含话题桥接少量已标注的图像和大量未标注的图像,利用已标注图像的Must-link约束和Cannot-link约束提高未标注图像分类的精度。实验结果表明,该方法有效提高Caltech-101数据集和7类图像集约10%的分类精度。此外,针对目前绝大部分半监督图像分类方法不具备增量学习能力这一缺点,提出该方法的增量学习模型。实验结果表明,增量学习模型相比无增量学习模型提高近90%的计算效率。关键词半监督学习,图像分类,增量学习中图法分类号TP391。41IncrementalImageClassificationMethodBasedonSemi-SupervisedLearningLIANGPeng1,2,LIShao-Fa2,QINJiang-Wei2,LUOJian-Gao31(SchoolofComputerScienceandEngineering,GuangdongPolytechnicNormalUniversity,Guangzhou510665)2(SchoolofComputerScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510006)3(DepartmentofComputer,GuangdongAIBPolytechnicCollege,Guangzhou510507)ABSTRACTInordertouselargenumbersofunlabeledimageseffectively,animageclassificationmethodisproposedbasedonsemi-supervisedlearning。Theproposedmethodbridgesalargeamountofunlabeledimagesandlimitednumbersoflabeledimagesbyexploitingthecommontopics。Theclassificationaccuracyisimprovedbyusingthemust-linkconstraintandcannot-linkconstraintoflabeledimages。TheexperimentalresultsonCaltech-101and7-classesimagedatasetdemonstratethattheclassificationaccuracyimprovesabout10%bytheproposedmethod。Furthermore,duetothepresentsemi-supervisedimageclassificationmethodslackingofincrementallearningability,anincrementalimplementationofourmethodisproposed。Comparingwithnon-incrementallearningmodelinliterature,theincrementallearningmethodimprovesthecomputationefficiencyofnearly90%。
2012 Vol. 25 (1): 111-117 [摘要] ( 794 ) [HTML 1KB] [PDF 416KB] ( 690 )
118 基于查询聚类的排序学习算法
花贵春,张敏,刘奕群,马少平,茹立云
排序学习算法作为信息检索与机器学习的一个交叉领域,越来越受到人们的重视。然而,几乎没有排序学习算法考虑到查询差异的存在。文中查询被建模为多元高斯分布,KL距离被用来度量查询之间的距离,利用谱聚类方法对查询进行聚类,为每个聚类类别训练一个排序函数。实验结果表明经过聚类得到的排序函数需要较少的训练样例,但是它的性能却和没有经过聚类得到的排序函数具有可比性,甚至优于后者。
2012 Vol. 25 (1): 118-123 [摘要] ( 769 ) [HTML 1KB] [PDF 354KB] ( 628 )
124 基于稀疏表示的多标记学习算法
宋相法,焦李成
为解决多标记数据的分类问题,提出基于稀疏表示的多标记学习算法。首先将待分类样本表示为训练样本集上的稀疏线性组合,基于l1-最小化方法求得最稀疏的系数解。然后利用稀疏系数的判别信息提出一个计算待分类样本对各标记的隶属度的方法。最后根据隶属度对标记进行排序,进而完成分类。在Yeast基因功能分析、自然场景分类和web页面分类上的实验表明,该算法能够有效解决多标记数据的分类问题,与其它方法相比取得更好的结果。
2012 Vol. 25 (1): 124-129 [摘要] ( 716 ) [HTML 1KB] [PDF 399KB] ( 815 )
130 连续语音解码阈值参数的优化
尹明明,李弼程,屈丹,牛铜
针对目前连续语音识别解码过程中剪枝阈值的确定不能兼顾解码速度与精度的不足,文中提出一种多维剪枝阈值参数联合优化算法。该算法主要研究全局阈值、词尾阈值、激活模型数、令牌数四维剪枝阈值参数的优化,其优化的主要过程是首先应用多目标优化理论对这四维阈值参数进行联合优化,然后根据优化结果采用分段动态阈值的方法进行后处理。实验结果表明,采用该方法优化后的阈值参数进行一遍解码,解码器的剪枝性能得到明显改善,搜索空间的大小得到有效控制,达到预期的速度与精度权衡的优化效果。
2012 Vol. 25 (1): 130-135 [摘要] ( 528 ) [HTML 1KB] [PDF 436KB] ( 570 )
136 单幅雾天图像的同步去噪与复原
方帅,王峰,占吉清,曹洋,袁宏武饶瑞中

在单幅雾天图像复原中图像不可避免地存在大量噪声,这会对复原结果带来很大影响。文中提出一种基于联合双边滤波的单幅雾天图像同步去噪和复原算法。该算法首先根据暗通道先验假设估计出可反映场景深度特性的初始传输图。其次,利用联合双边滤波器,在原始图像的引导下对初始的粗糙传输图进行细化,有效降低光晕现象的出现。再使用一次双边滤波求解复原图像,在得到去雾图像的同时实现图像去噪。最后,在滤波过程中引入一个色彩恢复因子,解决复原过程引起的色彩失真问题。文中对各种类型的图片进行对比实验,结果表明该算法能在去雾的同时有效抑制图像中的噪声,并保持较低的计算复杂度。此外,引入的色彩恢复因子也给复原图像带来丰富的色彩。

2012 Vol. 25 (1): 136-142 [摘要] ( 362 ) [HTML 1KB] [PDF 757KB] ( 765 )
143 一种监督的局部保持典型相关分析算法
侯书东,孙权森,夏德深
从模式分类的角度出发,提出一种监督的局部保持典型相关分析(SLPCCA),通过最大类内成对样本与其近邻间的权重相关性,因而能有效利用样本类别信息的同时保持数据的局部流形结构,并且融合判别型典型相关分析(DCCA)的鉴别信息而不受总类别数的限制。此外,为了提取数据的非线性特征,在核方法的基础上又提出一种核化的SLPCCA(KSLPCCA)。在ORL、Yale、AR和FERET等人脸数据库的实验结果表明,该算法比其他传统的典型相关分析方法具有更好的识别效果。
2012 Vol. 25 (1): 143-149 [摘要] ( 425 ) [HTML 1KB] [PDF 473KB] ( 501 )
150 基于非最大抑制聚类的视频人数估测方法
吕济民,曾昭贤,张茂军
对于基准背景已知的固定场景,提出估测人数的四步框架,相比2010年D。Conte等的结果显著提高远距离人群的估测精度。精度提高的主要原因在于“非最大抑制聚类”,这种基于密度的聚类方法对不同拍摄距离的人群采取不同的聚类标准,避免类过大造成的后续问题。PETS2010数据库的实验表明,远距离高密度人群因被分为多类,估测精度明显提高。
2012 Vol. 25 (1): 150-156 [摘要] ( 286 ) [HTML 1KB] [PDF 448KB] ( 543 )
157 基于频繁项集的互补替代关系挖掘算法
柴玉梅,王春丽,王黎明
以TOP-k-ClosedMiner算法为基础,提出基于索引的频繁项集挖掘算法Index-FIM。该算法用位向量表示数据集,同时引入广度扩展剪枝和区域索引跳过策略。实验表明,Index-FIM算法在稀疏数据集上挖掘频繁项集具有较高的执行效率。为得到能直接用于预测的有效信息,提出基于频繁项集的互补替代关系挖掘算法(CARM)。通过对已挖掘出的各频繁项集中的频繁项进行相关性计算,得到频繁项之间的互补替代关系,并以互补替代关系图(CAG)的形式直观表示,便于决策者做出准确、合理的判断。实验表明,CAG比频繁项集表示的信息更有效、更精确。
2012 Vol. 25 (1): 157-165 [摘要] ( 333 ) [HTML 1KB] [PDF 534KB] ( 951 )
166 一种基于人耳听觉感知和子带补偿滤波的鲁棒语言辨识特征参数提取算法
黄山奇,张连海,屈丹
针对目前语言辨识系统所采用的特征参数没有充分考虑人耳听觉机制、鲁棒性较差的问题,提出一种符合人耳听觉感知特性的鲁棒语言辨识参数提取算法。该算法主要从两个方面提高特征参数的鲁棒性:在计算各子带能量时采用更符合人耳感知特性的Gammachirp滤波器组代替常用的三角滤波器组;为每一子带通道设计一个补偿滤波器。子带补偿滤波器的设计采用数据驱动的策略,通过补偿使得各子带滤波器输出信号的失真及环境噪音导致的失真同时达到最小。实验表明,文中所提出的特征在常见噪声环境下,性能均优于目前普遍使用的Mel频率倒谱系数特征及其衍生参数。关键词听觉感知,补偿滤波器,鲁棒性,语言辨识中图法分类号TN912。3ARobustFeatureParameterExtractionAlgorithmforLanguageIdentificationBasedonAudioPerceptionandSub-BandCompensationFilteringHUANGShan-Qi,ZHANGLing-Hai,QUDan(InstituteofInformationEngineering,InformationEngineeringUniversityofPLA,Zhengzhou450002)ABSTRACTIncurrentlanguageidentificationsystem,thecommonlyusedfeatureparametershavenotmadethebestuseofauditorycharacteristicsandhaveweakrobustnessincomplexenvironments。Anauditory-basedrobustfeatureextractionalgorithmisproposed。Eachsub-bandenergyoftheextractedauditoryfeaturesiscalculatedbyusingaGammachirpfilterbankinsteadofthecommonlyusedtrianglefilterbank。Thecompensationfilterusingdata-drivenanalysisforeachsub-bandoutputisobtainedbyaconstrainedoptimizationprocesswhichjointlyminimizestheenvironmentaldistortionaswellasthedistortioncausedbythefilteritself。ExperimentalresultsshowthatthefeatureoutperformstheMel-frequencycepstralcoefficientwidelyusedinnoisyenvironments。
2012 Vol. 25 (1): 166-171 [摘要] ( 285 ) [HTML 1KB] [PDF 380KB] ( 506 )
172 基于一元事件的认知模型
冯康,姚南生
从认知模型中发现认知的规律,设计一种基于一元事件的认知模型。它以认识为认知对象,认知架构包含感悟机构、接受机构、记忆机构、任务机构、推理机构和思考机构。对于同一个认知流程,在记忆体的容量取不同值的环境下,检验模型对认知的模拟,记录记忆体中认识的变化,计算认知指标。模型能够模拟认知,随着认知的进行,记忆体中认识的范数、单元数、复杂度及所在行的清晰度都发生改变。当容量增加时,所有的认知指标均有不同程度的提高,而完成任务能够改变认知模型的所有认知指标。
2012 Vol. 25 (1): 172-180 [摘要] ( 296 ) [HTML 1KB] [PDF 581KB] ( 785 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn