模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2006, Vol. 19 Issue (3): 289-294    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种有效的高属性维稀疏数据聚类算法*
赵亚琴1,周献中2,何新1,王建宇1
1.南京理工大学 自动化学院 南京 210094
2.南京大学 工程管理学院 南京 210093
An Effective High Attribute Dimensional Sparse Clustering
ZHAO YaQin1, ZHOU XianZhong2, HE Xin1, WANG JianYu1
1.School of Automation, Nanjing University of Science and Technology, Nanjing 210094
2.School of Management and Engineering, Nanjing University, Nanjing 210093

全文: PDF (378 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 聚类分析是数据挖掘最常见的技术之一,数据的规模、维数和稀疏性都是制约聚类分析的不同方面.本文提出一种有效的高属性维稀疏数据聚类方法.给出稀疏相似度、等价关系的相似度、广义的等价关系的定义.基于对象间的稀疏相似度和等价关系原理形成初始等价类,通过等价关系的相似度修正初始等价关系,使得最终聚类结果更合理.该算法聚类过程不依赖于输入样本的排列顺序,高维稀疏数据的有效压缩提高算法在维数较高时的执行效率,适合于高维稀疏数据的聚类分析.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
赵亚琴
周献中
何新
王建宇
关键词 稀疏相似度等价关系的相似度数据压缩聚类    
Abstract:Clustering analysis is one of the most important techniques in data mining with scale, dimension and sparseness of dataset being three key factors that influence accuracy of clustering. An effective clustering algorithm for the high attribute dimension sparse data is proposed in this paper. Definitions are given, such as sparse similarity, similarity between equivalence relations and generalized equivalence relation. Based on these definitions, the theory of equivalence relation is applied to form initial clusters. Initial equivalence relations are modified in terms of the similarity between two equivalence relations in order to obtain more reasonable clustering results. High dimensional sparse data is effectively compressed and expressed as sparse feature vector whose dimension is far lower than that of original data. As a result, the proposed approach can handle an array of high dimensional sparse data with high efficiency, and be independent of sequence of the objects.
Key wordsSparse Similarity    Similarity between Equivalence Relations    Data Compression    Clustering   
收稿日期: 2005-01-07     
ZTFLH: TP18  
基金资助:江苏省自然科学基金资助项目(No.BK2004137)
作者简介: 赵亚琴,女,1973年生,博士研究生,主要研究方向为数据挖掘、智能信息处理.E-mail: yaqinzhao@126.com.周献中,男,1962年生,教授,博士生导师,主要研究方向为智能信息处理、信息系统工程、指挥自动化.何新,男,1979年生,博士研究生,主要研究方向为信息提取、基于内容的音频检索.王建宇,男,1964年生,教授,主要研究方向为图像处理、计算机仿真.
引用本文:   
赵亚琴,周献中,何新,王建宇. 一种有效的高属性维稀疏数据聚类算法*[J]. 模式识别与人工智能, 2006, 19(3): 289-294. ZHAO YaQin, ZHOU XianZhong, HE Xin, WANG JianYu. An Effective High Attribute Dimensional Sparse Clustering. , 2006, 19(3): 289-294.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2006/V19/I3/289
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn