模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2014年 27卷 7期 刊出日期 2014-07-30

论文与报告
研究与应用
 
论文与报告
577 基于免疫猫群优化算法的矢量量化的码书设计及语音识别*
杨淑莹,刘旭鹏,陶冲,刘婷婷
在矢量量化的码书设计过程中,针对传统的 LBG算法对初始码书选取的依赖性及易陷入局部最优的缺陷,提出基于免疫猫群优化算法的矢量量化码书设计.将整个种群分为搜索组和跟踪组,运用克隆扩增算子在搜寻组中进行局部搜索,根据适应度值大小调节变异个体数目,保持解的多样性.运用动态疫苗提取与接种算子使跟踪组个体基因与疫苗进行交叉变异,向最优解靠拢,防止无监督交叉变异可能引起的退化现象.通过浓度平衡算子和选择算子更新子代种群,防止种群“早熟”.将训练出全局最优码书输入到HMM模型进行训练和识别,实验结果表明,基于免疫猫群优化算法的矢量量化码书设计不依赖于初始码书选取,鲁棒性强且降低语音识别误差率.
2014 Vol. 27 (7): 577-583 [摘要] ( 580 ) [HTML 1KB] [PDF 479KB] ( 824 )
584 基于Logistic回归模型的时变结构基因调控网络构建*
倪小虹,孙应飞
目前,由大多数基因调控网络的重构方法推导出的网络结构是静态的,即不随时间改变.但在细胞周期或一个有机体的不同生长阶段,调控网络的拓扑结构会发生显著变化.这为深入了解基因调控的时空机制带来困难.因此,文中提出一种基于时延互信息和核权重l1正则化Logistic回归模型学习时变结构基因调控网络的算法.将其应用于两种生物情景数据:黑腹果蝇在不同阶段的肌肉发育和酿酒酵母苯菌灵中毒后的反应.实验结果显示,该方法能反映不同细胞状态对基因间相互作用的影响,有效获取基因调控网络随时间变化的动态效应.
2014 Vol. 27 (7): 584-550 [摘要] ( 408 ) [HTML 1KB] [PDF 626KB] ( 982 )
591 CP-nets上的正则化路径查询*
刘惊雷,廖士中
从表示偏好知识的条件偏好网(CP-nets)模型出发, 研究该模型上的正则化路径查询问题.首先从数据库的观点给出偏好数据库的两类查询(顶点查询和路径查询),并证明偏好数据库的表达能力强于关系数据库.其次,通过构造正则表达式的语法解析二叉树,求出各自原子表达式诱导的可达关系,从而利用动态规划法求解出CP-nets上正则表达式所诱导的可达关系,并证明算法的正确性,分析其组合复杂度.最后,给出正则化路径查询的可能应用,即可在偏好操作序列的规划中使用.
2014 Vol. 27 (7): 591-598 [摘要] ( 464 ) [HTML 1KB] [PDF 394KB] ( 853 )
599 带有矛盾否定、对立否定和中介否定的模糊推理*
张胜礼
随着知识处理研究的发展,对“否定知识”的认识和处理受到广泛关注.先扩展关于Fuzzy判断句的否定认识,构造带有矛盾否定、对立否定和中介否定的Fuzzy判断句,并给出相应的语义描述和一种逻辑描述.在此基础上扩展真域模型的概念,得到带有不同否定的3种Fuzzy推理规则,并且给出一种CRI算法的推广算法,继而给出一个具体的应用示例.
2014 Vol. 27 (7): 599-610 [摘要] ( 383 ) [HTML 1KB] [PDF 474KB] ( 783 )
研究与应用
611 光学运动捕捉系统中标记点自动注册与预测算法*
谭光华,周美兰,高春鸣,李仁发
针对光学运动捕获系统中散乱数据注册问题,提出一种基于首帧标记点分割的标记点注册方法.该方法首先利用人体拓扑结构对首帧散乱数据进行分割,然后根据标记点局部刚性特征和时空信息完成注册,无需手工指定初始模板.对于存在缺失的数据,基于相邻帧标记点运动变化不大的假设,利用标记点的局部刚性特征对缺失数据进行预测.实验结果表明,该方法能快速且准确地标注各标记点,具有较好的鲁棒性和实时性.
2014 Vol. 27 (7): 611-616 [摘要] ( 477 ) [HTML 1KB] [PDF 873KB] ( 1169 )
617 基于稀疏描述的SAR目标型号识别算法*
刘明,吴艳,王凡,张强,李明
对样本进行稀疏描述,可获得充分描述样本特征且具备区分能力的稀疏向量.提出一种基于稀疏描述的SAR目标型号识别算法.首先,对目标SAR图像进行特征提取,以抑制斑点噪声的影响.然后,利用全体训练样本构造字典矩阵,将测试样本在字典矩阵上进行投影得到其稀疏向量.最后,根据拥有相同标号且方位角最接近的样本之间差异最小的特点,构造单个样本重构误差最小准则,实现SAR目标的型号识别.在MSTAR数据上的实验验证了本文算法的有效性.
2014 Vol. 27 (7): 617-622 [摘要] ( 441 ) [HTML 1KB] [PDF 541KB] ( 787 )
623 查询无关排序主题模型*
肖智博,车丰,吴镝,李庆丰,鲁明羽
主题模型已成为机器学习和自然语言处理等领域研究的重要工具,它可发现大规模语料库中的隐含主题.随着语料库规模增大,发现的主题规模也随之增大.绝大多数主题模型以词袋模型为基础,无法描述词项间的顺序关系,使得主题之间无法按照重要性区分.文中提出查询无关排序主题模型框架,利用主题间各种关系排序主题,得到有序主题列表.主题关系从主题层面评价主题影响度,继而提出词项贡献度,从词项语义层面评价主题,削弱流行但语义空泛的排序主题.由于排序主题模型尚未有公认的评价标准,将有序主题作为特征进行多文档自动文摘生成,通过文摘效果间接评价主题排序的效果.实验结果证明有序主题模型优于非排序主题模型的结果.
2014 Vol. 27 (7): 623-630 [摘要] ( 412 ) [HTML 1KB] [PDF 474KB] ( 934 )
631 Web语料抓取中基于相似度的URL过滤规则生成算法*
陈荟慧,舒云星,林丽
Web语料是语料库的重要组成部分,但对冗余URL的访问开支影响大规模语料爬取工作的质量和效率,使用高效的URL过滤规则可提高Web爬取的质量和效率.因网站虚拟目录下的文件分布不均匀,为发现目标文件聚集区域,提出一种生成URL过滤规则的方法.该方法使用正则表达式将URL元素通配化,归并相同元素后划分为子集,再计算子集内URL之间的相似度,并根据相似程度较高的URL构造虚拟目录树,基于虚拟目录树生成语料爬取的URL过滤规则和分类规则.文中详细介绍虚拟目录树的生成算法,并通过实验对比不同相似度阈值对目录树生成结果和URL过滤效果的影响.
2014 Vol. 27 (7): 631-637 [摘要] ( 612 ) [HTML 1KB] [PDF 717KB] ( 14636 )
638 面向增量更新数据库的隐私保护*
陈文
敏感模式隐藏是隐私保护数据挖掘中的一个重要课题.传统算法大多适用于处理静态数据,因此难以处理增量更新数据中的隐私保护问题.为解决以上问题,设计基于敏感模式图满足最小边际效应的牺牲项选择策略,构建面向增量数据库的隐私保护算法.实例和实验分析验证了算法的正确性、高效率及可扩展性.
2014 Vol. 27 (7): 638-645 [摘要] ( 433 ) [HTML 1KB] [PDF 567KB] ( 714 )
646 基于强类别特征近邻传播的半监督文本聚类*
文翰,肖南峰
为处理高维稀疏的大规模文档数据,提出一种基于强类别特征近邻传播(SCFAP)的半监督文本聚类算法.聚类过程中,利用少量带类别标签的监督数据,提取具有强类别区分能力的特征项以构建更有效的样本间相似性测度.并在每轮迭代完成后将类别确定性程度最高的未标记样本转移到已标注集,使算法执行效率提高.实验结果表明,这种改进对于近邻传播算法的性能和准确度的提升有较大帮助,在Reuter-21578和20Newsgroups两个相异数据集上,SCFAP算法表现较好的适用性.综合考察聚类微平均Fμ指标和类簇纯度Pt指标,该算法在少量监督信息辅助下能快速获得较好的聚类结果.
2014 Vol. 27 (7): 646-654 [摘要] ( 391 ) [HTML 1KB] [PDF 639KB] ( 775 )
655 基于图模型的道路检测方法*
柏猛,李敏花
为解决城市环境低速移动机器人的道路检测问题,提出一种基于图模型的道路检测方法.首先,将道路图像划分为子图,计算子图特征向量,生成图模型结点集.然后,提出相近半径概念,计算相近结点边权值,生成图模型边集.在此基础上,采用基于最小生成树的结点合并规则对图模型结点进行合并,实现道路图像分割.最后,通过设置取样窗口,提取道路结点,分割出道路区域.通过实验分析道路检测精度与子图尺寸及阈值参数间的关系,研究采用灰度特征进行道路检测的可行性.实验结果表明,该方法能有效检测出不同类型道路图像中的道路区域,适用于道路检测.
2014 Vol. 27 (7): 655-662 [摘要] ( 514 ) [HTML 1KB] [PDF 2224KB] ( 817 )
663 基于群体智能的半结构化藏文文本聚类算法*
康健,乔少杰,格桑多吉,韩楠,洪西进,尼玛扎西,范小刚

将群体智能技术应用于半结构化的藏文Web文本聚类,提出基于群体智能的半结构化藏文Web文本聚类算法 (SCAST).充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响,SCAST算法首先运用向量空间模型表示藏文文本信息,将藏文文本和智能蚁群随机放置于一个文本向量空间中.然后智能蚂蚁随机选择藏文文本,计算藏文文本在当前局部区域内的相似性,获得拾起或者放下文本的概率,进而决定是否“拾起”,“移动”,“放下”藏文文本.最后通过多次迭代训练,将藏文文本按其相似性聚集在一起,得到最终聚类结果.大量真实藏文Web文本数据上的实验结果表明,相较于传统的k-means聚类算法,基于群体智能的藏文文本聚类算法在聚类准确率上平均提高约8.0%.

2014 Vol. 27 (7): 663-672 [摘要] ( 498 ) [HTML 1KB] [PDF 1001KB] ( 786 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn