模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2016, Vol. 29 Issue (1): 82-89    DOI: 10.16451/j.cnki.issn1003-6059.201601010
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于维度频率相异度和强连通融合的混合数据聚类算法*
钱潮恺,黄德才
浙江工业大学 计算机科学与技术学院 杭州 310014
Clustering Algorithm for Mixed Data Based on Dimensional Frequency Dissimilarity and Strongly Connected Fusion
QIAN Chaokai, HUANG Decai
College of Computer Science and Technology, Zhejiang University of Technology, Hangzhou 310014

全文: PDF (484 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 k-Prototypes算法对初始点选取的敏感性导致聚类结果具有随机性,并且忽视样本数据点与聚类集合中已有样本的总体差异.针对此问题,文中提出基于维度频率相异度和强连通融合的混合数据聚类算法,首先通过多次预聚类产生大量子簇,然后根据子簇之间的连通关系,采用强连通融合的策略得到最终的聚类结果.在UCI数据库中3个混合属性数据集上的实验表明,相比k-Prototypes算法及已有的混合属性聚类算法,文中算法具有更好的聚类质量,从而验证文中算法的优越性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
钱潮恺
黄德才
关键词 维度频率相异度 混合属性 聚类 强连通融合    
Abstract:The clustering result of k-Prototypes algorithm is unpredictable due to the sensitivity of the initial prototypes selection. Moreover, the whole diversity between data points and clusters is ignored. Therefore, a clustering algorithm based on dimensional frequency dissimilarity and strongly connected fusion is proposed. Plenty of sub-clusters are produced by multiple pre-clustering. According to the connectivity of those sub-clusters, strongly connected fusion is used to generate the final clusters. The proposed clustering algorithm is validated on three different UCI datasets. Meanwhile, it is compared with three mixed data clustering algorithms. The experimental results show that the proposed algorithm can yield better clustering precision and purity.
Key wordsDimensional Frequency Dissimilarity    Mixed Attribute    Clustering    Strongly Connected Fusion   
收稿日期: 2014-08-18     
ZTFLH: TP 391.4  
基金资助:水利部公益性行业科研专项项目(No.201401044)资助
作者简介: 钱潮恺,男,1990年生,硕士研究生,主要研究方向为数据挖掘.E-mail:nicholaschan@hotmail.com.黄德才(通讯作者),男,1958年生,博士,教授,主要研究方向为数据挖掘、人工智能等.E-mail:hdc@zjut.edu.cn.HUANG Decai
引用本文:   
钱潮恺,黄德才. 基于维度频率相异度和强连通融合的混合数据聚类算法*[J]. 模式识别与人工智能, 2016, 29(1): 82-89. QIAN Chaokai, HUANG Decai. Clustering Algorithm for Mixed Data Based on Dimensional Frequency Dissimilarity and Strongly Connected Fusion. , 2016, 29(1): 82-89.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201601010      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2016/V29/I1/82
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn