模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2016, Vol. 29 Issue (1): 11-21    DOI: 10.16451/j.cnki.issn1003-6059.201601002
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
快速可扩展的子空间聚类算法*
刘博1,2,谢博鋆1,3,朱杰1,4,景丽萍1,于剑1
1.北京交通大学 计算机与信息技术学院 交通数据分析与挖掘北京市重点实验室 北京 100044
2.河北农业大学 信息科学与技术学院 保定 071001
3.河北大学 数学与信息技术学院 河北省机器学习与计算智能重点实验室 保定 071002
4.中央司法警官学院 信息管理系 保定 071000
Fast Scalable Subspace Clustering Algorithm
LIU Bo1,2, XIE Bojun1,3, ZHU Jie1,4, JING Liping1, YU Jian1
1.Beijing Key Laboratory of Traffic Data Analysis and Mining, School of Computer and Information Technology,Beijing Jiaotong University, Beijing 100044
2.College of Information Science and Technology, Agricultural University of Hebei, Baoding 071001
3.Hebei Province Key Laboratory of Machine Learning and Computational Intelligence, College of Mathematics and Information Science, Hebei University, Baoding 071002
4.Department of Information Management, The National Police University for Criminal Justice, Baoding 071000

全文: PDF (1268 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 子空间聚类算法只能处理小规模数据,且无法处理样本外数据.针对此问题,文中提出采用二次采样策略的子空间聚类框架(TSSC).该框架由两个核心部件组成:判别性协作表示(DCR)与多尺度K近邻(KNN)采样方法.在TSSC中,DCR首先结合多尺度KNN对数据点进行特征变换,从而保证属于同一子空间的点有更一致的表示.为了提高算法的可扩展性,TSSC在新的特征空间中使用多尺度KNN对数据进行二次采样,并根据采样点获得的初步聚类结果训练线性分类器,最后根据学习得到的分类器对剩余样本点进行分类,获得最终的聚类结果.在真实数据集上的实验验证TSSC的有效性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘博
谢博鋆
朱杰
景丽萍
于剑
关键词 子空间聚类 自表示 判别性协作表示 多尺度K近邻    
Abstract:Most existing subspace clustering methods are inefficient for large scale datasets and are unable to handle out-of-sample data. To address these problems, a framework is proposed called two-stage sample selection for subspace clustering (TSSC). TSSC consists of two key components: discriminative collaborative representation (DCR) and multi-scale K nearest neighbors (KNN). DCR is combined with multi-scale KNN for feature mapping, and thus the samples belonging to the same subspace have more consistent representation. To enhance the scalability of the algorithm, multi-scale KNN is reused to select some information points from the new feature space by TSSC. Then, a linear classifier is trained according to the clustering result produced by the pre-selected points. Finally, the rest samples are categorized to obtain the final clustering result. Experiments conducted on the real-world datasets verify the effectiveness of TSSC.
Key wordsSubspace Clustering    Self-expression    Discriminative Collaborative Representation    Multi-scale K Nearest Neighbors   
收稿日期: 2015-05-13     
ZTFLH: TP 301  
基金资助:国家自然科学基金项目(No.61370129,61375062)、教育部高等学校博士学科点专项科研基金项目(No.20120009110006)、长江学者和创新团队发展计划(No.IRT201206)、中央高校基本科研业务费基金项目(No.2014JBM029)资助
作者简介: 刘 博,男,1981年生,博士研究生,主要研究方向为子空间学习、半监督学习、人脸识别.E-mail:liubohbu@126.com.谢博鋆,男,1981年生,博士研究生,主要研究方向为机器学习、计算机视觉.E-mail:8054499@qq.com.朱 杰,男,1982年生,博士研究生,主要研究方向为机器学习、对象识别、图像分类.E-mail:13633589@qq.com.景丽萍(通讯作者),女,1978年生,博士,教授,主要研究方向为数据挖掘、文本挖掘、生物信息学、企业智能.E-mail:lipingjing@bjtu.edu.cn.于 剑,男,1969年生,博士,教授,主要研究方向为聚类分析、图像处理.E-mail:jianyu@bjtu.edu.cn.
引用本文:   
刘博,谢博鋆,朱杰,景丽萍,于剑. 快速可扩展的子空间聚类算法*[J]. 模式识别与人工智能, 2016, 29(1): 11-21. LIU Bo, XIE Bojun, ZHU Jie, JING Liping, YU Jian. Fast Scalable Subspace Clustering Algorithm. , 2016, 29(1): 11-21.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201601002      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2016/V29/I1/11
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn