模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2010, Vol. 23 Issue (4): 546-551    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于k最近邻网络的数据聚类算法
金弟1,2,刘杰1,2,3,贾正雪4,刘大有1,2
1.吉林大学 计算机科学与技术学院 长春 130012
2.吉林大学 符号计算与知识工程教育部重点实验室 长春 130012
3.复旦大学 智能信息处理上海市重点实验室 上海 200433
4.一汽大众汽车有限公司 长春 130012
k-Nearest-Neighbor Network Based Data Clustering Algorithm
JIN Di1,2,LIU Jie1,2,3,JIA Zheng-Xue4,LIU Da-You1,2
1.College of Computer Science and Technology,Jilin University,Changchun 130012
2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012
3.Shanghai Key Laboratory of Intelligent Information Processing,Fudan University,Shanghai 200433
4.FAW VW Automobile Co.,Ltd.,Changchun 130012

全文: PDF (422 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 聚类研究在数据挖掘研究领域中占有十分重要的地位。虽然目前已有很多数据聚类算法,但精度仍不够理想。文中提出一个基于结构化相似度的网络聚类算法(SSNCA),试图从网络聚类角度进一步提高数据聚类精度。具体解决方案是,将待聚类的向量数据集转化为k最近邻网络,并用SSNCA对该网络进行聚类。将SSNCA与c-Means、仿射传播进行比较,实验表明文中算法得到的目标函数稍差,但聚类精度要明显高于这两个算法。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 数据挖掘数据聚类k最近邻网络复杂网络聚类    
Abstract:Data clustering is a hotspot in data mining area. Though there have been lots of data clustering algorithms now, the clustering accuracy of them is far from perfect. A structural similarity based network clustering algorithm (SSNCA) is proposed in this paper, which attempt to further improve the data clustering accuracy from the view of network clustering. The concrete solution scheme is that vector dataset for clustering is converted to a k-Nearest-Neigborhood network and SSNCA is used to cluster this network. Comparing SSNCA with the algorithms of c-Means and affinity propagation (AP), experimental result shows that the fitness value got by the proposed algorithm is a little worse than AP, but its clustering accuracy is obviously better than that of the other two algorithms.
Key wordsData Mining    Data Clustering    k-Nearest-Neighbor Network    Complex Network Clustering   
收稿日期: 2009-04-27     
ZTFLH: TP181  
基金资助:国家自然科学基金项目(No.60873149,60973088)、国家863计划项目(No.2006AA10Z245)资助
作者简介: 金弟,男,1981年生,博士研究生,主要研究方向为复杂网络分析、数据挖掘.刘杰,女,1973年生,博士,副教授,主要研究方向为数据挖掘、离散数学.贾正雪,男,1982年生,硕士,主要研究方向为语义Web、数据挖掘.刘大有,男,1942年生,教授,博士生导师,主要研究方向为知识工程与专家系统、Agent系统、时空推理和数据挖掘等.E-mail:liudy@jlu.edu.cn.
引用本文:   
金弟,刘杰,贾正雪,刘大有. 基于k最近邻网络的数据聚类算法[J]. 模式识别与人工智能, 2010, 23(4): 546-551. JIN Di,LIU Jie,JIA Zheng-Xue,LIU Da-You. k-Nearest-Neighbor Network Based Data Clustering Algorithm. , 2010, 23(4): 546-551.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2010/V23/I4/546
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn