模式识别与人工智能
   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能
22 学术不端论文认定及处理办法
22 版权转让协议
22 保密证明
22 录用稿件电子版要求
22 修改说明格式
更多....
22 中国自动化学会
22 国家智能计算机研发中心
22 中科院合肥智能机械所
更多....
 
 
2017年 30卷 1期 刊出日期 2017-01-31

论文与报告
研究与应用
 
论文与报告
1 基于聚类假设的数据流分类算法*
李南
获取数据流上样本的真实类别的代价很高,因此标记所有样本的方式缺乏实用性,而随机标记部分样本又会导致模型的不稳定.针对上述问题,文中提出基于聚类假设的数据流分类算法.基于通过聚类算法分到同类中的样本可能具有相同类别这一聚类假设,利用训练数据集上的聚类结果拟合样本的分布情况,在分类阶段有目的性地选取很难分类或潜在概念漂移的样本更新模型.为了训练数据集上每个类别的样本,建立各自对应的基础分类器,当数据流中样本的类别消失或重现时,只需要冻结或激活与之对应的基础分类器,而无需再重新学习之前已经掌握的知识.实验表明,文中算法能够在适应概念漂移的前提下,减少更新模型需要的样本数量,并且取得和当前数据流上的分类算法相当或更好的分类效果.
2017 Vol. 30 (1): 1-10 [摘要] ( 814 ) [HTML 1KB] [PDF 530KB] ( 756 )
11 多粒度邻域粗糙直觉模糊集模型*
薛占熬,司小朦,袁艺林,辛现伟
针对名义型属性和数值型属性并存的混合型数据,结合多粒度邻域粗糙集和直觉模糊集,分别定义模糊覆盖粗糙隶属度和非隶属度.基于不同的属性集序列和不同的邻域半径,构建多粒度邻域粗糙直觉模糊集模型,证明模型相关性质.然后提出乐观和悲观多粒度邻域粗糙直觉模糊集的近似集,并讨论模型性质.最后使用文中模型计算实例,说明其能较好地解决名义型属性和数值型属性的混合型数据的处理问题.
2017 Vol. 30 (1): 11-20 [摘要] ( 505 ) [HTML 1KB] [PDF 621KB] ( 304 )
21 自组织决策树的联想记忆在线学习模型*
谢振平,孙桃
针对多源数据在线学习环境下的联想记忆建模问题,并综合考虑计算高效性、噪声鲁棒性等目标,提出基于自组织决策树的联想记忆在线学习模型.首先根据模式数据内在结构进行类内信息增强和噪声约简,然后基于信息熵增益的决策树算法对约简后数据进行子域划分,最后通过子域关系学习建模多源数据的联想关系.理论分析模型的学习稳定性.实验表明,文中模型在含噪数据在线分类学习和异联想建模问题上具有优良性能.
2017 Vol. 30 (1): 21-31 [摘要] ( 587 ) [HTML 1KB] [PDF 1891KB] ( 455 )
32 基于双随机场能量函数的区域化图像分割*
赵泉华,赵雪梅,李摇玉
为了提高图像分割算法的抗噪性,并充分利用特征场和标号场在能量函数分割模型中的作用,提出基于双随机场能量函数的区域化图像分割方法.首先,利用几何划分将图像域划分为一系列子区域.在此基础上,采用多值高斯分布的负对数定义区域化特征场能量函数,用于描述同质区域内像素颜色的统计分布一致性.扩展传统建模邻域像素标号关系的Potts模型至邻域子区域,定义区域化标号场能量函数,用于表征各子区域标号之间的相关性.联合特征场和标号场,采用KL散度定义异质性能量函数,用于刻画同质区域间颜色统计分布异质性.利用非约束吉布斯表达式将定义的特征场和标号场能量函数转换为描述图像分割的概率分布函数.最后,在最大化上述概率分布函数准则下,设计合适的M-H采样算法,获得最优图像分割.在合成图像、遥感图像和自然纹理图像上进行分割实验,验证文中方法的有效性和准确性.
2017 Vol. 30 (1): 32-42 [摘要] ( 538 ) [HTML 1KB] [PDF 1936KB] ( 536 )
研究与应用
43 基于Top-k查询约束的深网增量爬取*
江俊彦,彭智勇,吴小莹
深网数据源的动态性、自治性和体量使第三方应用难以完全爬取所有Web数据.文中研究查询类型(仅允许Top-k查询)和查询资源约束下深网数据源爬取问题,提出基于Top-k查询约束的深网增量爬取方法,结合历史数据和领域知识,优化总体数据质量.首先基于查询树获得有效查询,利用历史数据和领域知识估计查询变化和查询代价.然后,基于估计的查询代价和数据质量,近似选择最优的查询子集最大化总体数据质量.实验表明文中方法较好地提高动态Web数据库爬取的效率和数据质量.
2017 Vol. 30 (1): 43-53 [摘要] ( 376 ) [HTML 1KB] [PDF 892KB] ( 431 )
54 结合从句级远程监督与半监督集成学习的关系抽取方法*
余小康,陈 岭,郭敬,蔡雅雅,吴勇,王敬昌
针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实例的词法特征并转化为分布式表征向量,构建特征数据集.最后选择特征数据集中所有正例数据和部分负例数据组成标注数据集,其余的负例数据组成未标注数据集,通过改进的半监督集成学习算法训练关系分类器.实验表明,相比基线方法,文中方法可以获得更高的分类准确率和召回率.
2017 Vol. 30 (1): 54-63 [摘要] ( 622 ) [HTML 1KB] [PDF 956KB] ( 1150 )
64 多样性感知的时空文本信息的KNN查询处理方法*
李晨,申德荣,寇月,聂铁铮,于戈
如何在互联网上大量的带有地理位置标签和时间标签的信息中查找满足用户需求的信息十分重要.文中针对带有地理位置和时间标签的文本信息,提出多样性感知的时空文本信息的k近邻查询处理方法.首先,归一化处理数据对象的时空变量,并建立三维Rtree索引,有效融合数据对象的时间变量和空间变量.然后,提出多样性感知的k近邻查询算法(DST-KNN)和改进的DST-KNN(IDST-KNN).最后,通过基于大量数据集的实验验证文中查询处理方法的高效性和准确性.
2017 Vol. 30 (1): 64-72 [摘要] ( 429 ) [HTML 1KB] [PDF 930KB] ( 385 )
73 基于卷积神经网络和用户信息的微博话题追踪模型*
付鹏,林政,袁凤程,林海伦,王伟平,孟丹
为了解决微博文本特征抽取及特征稀疏问题,提出基于卷积神经网络的微博话题追踪模型(CNN-TTM).基于微博用户信息,又提出融合微博用户信息及卷积神经网络的微博话题追踪模型(CNN-UserTTM),利用微博用户信息提高话题追踪准确率.实验表明,在新浪微博数据集上,CNN-TTM和CNN-UserTTM分别获得较高的微博话题追踪准确率.
2017 Vol. 30 (1): 73-80 [摘要] ( 710 ) [HTML 1KB] [PDF 836KB] ( 851 )
81 基于凸差规划的不完整数据填充聚类
贺丹,陈松灿
为了提升聚类性能,文中提出基于凸差规划(DCP)的不完整数据填充聚类算法.采用DCP对核模糊C均值目标进行凸差化改造,实现DCP聚类和数据缺失项填充的交替优化过程,从理论上证明交替优化的收敛性.在UCI数据集上的实验验证文中算法在缺失数据填充和聚类上的优势.
2017 Vol. 30 (1): 81-88 [摘要] ( 424 ) [HTML 1KB] [PDF 550KB] ( 371 )
89 基于局部判别约束的半监督特征选择方法*
严菲,王晓栋
特征选择旨在选择待处理数据中最具代表性的特征,降低特征空间的维度.文中提出基于局部判别约束的半监督特征选择方法,充分利用已标记样本和未标记样本训练特征选择模型,并借助相邻数据间的局部判别信息提高模型的准确度,引入l2,1约束提高特征之间可区分度,避免噪声干扰.最后通过实验验证文中方法的有效性.
2017 Vol. 30 (1): 89-95 [摘要] ( 582 ) [HTML 1KB] [PDF 604KB] ( 471 )
模式识别与人工智能
 

主管:中国科学技术协会
主办:中国自动化学会
   国家智能计算机研究开发中心
   中国科学院合肥智能机械研究所
出版:科学出版社
 
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn