模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2014, Vol. 27 Issue (5): 410-416    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种非对称距离下的层次聚类算法*
韩忠明,陈 妮,张 慧,杨伟杰
北京工商大学 计算机与信息工程学院 北京 100048
A Hierarchical Clustering Algorithm Based on Asymmetric Distance
HAN Zhong-Ming,CHEN Ni,ZHANG Hui,YANG Wei-Jie
School of Computer and Information Engineering, Beijing Technology and Business University, Beijing 100048

全文: PDF (1260 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
韩忠明
陈妮
张慧
杨伟杰
关键词 非对称距离层次聚类数据挖掘    
Abstract:Hierarchical clustering algorithm is applied in many research fields such as data mining and machine learning. Most existing hierarchical clustering algorithms are dependent on symmetrical distances definition. In this paper, a hierarchical clustering algorithm is proposed based on asymmetric distance. With respect to asymmetric distance characteristics, a selective factor and corresponding calculation formula are proposed. The single linkage, full linkage and average linkage algorithms for the asymmetric hierarchical clustering algorithm are implemented. The hot tags from main social bookmarking systems are extracted and an asymmetric distance is defined based on co-occurrence frequency of different tags. The experimental results show that the proposed algorithm outperforms the clustering algorithm based on symmetrical distance. The cophenetic coefficient is also used to evaluate effectiveness of the algorithm.
Key wordsAsymmetric Distance    Hierarchical Clustering    Data Mining   
收稿日期: 2013-04-12     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61170112)、北京市属高等学校科学技术与研究生教育创新工程建设项目(No.PXM2012_014213_000037)资助
作者简介: 韩忠明(通讯作者),男,1972年生,博士,副教授,主要研究方向为互联网数据分析与挖掘、海量数据处理等.E-mail:hanzm@th.btbu.edu.cn.陈妮,女,1987年生,硕士研究生,主要研究方向为互联网数据分析与挖掘等.张慧,女,1989年生,硕士研究生,主要研究方向为互联网数据分析与挖掘等.杨伟杰,女,1980年生,博士,讲师,主要研究方向为互联网数据分析与挖掘等.
引用本文:   
韩忠明,陈妮,张慧,杨伟杰. 一种非对称距离下的层次聚类算法*[J]. 模式识别与人工智能, 2014, 27(5): 410-416. HAN Zhong-Ming,CHEN Ni,ZHANG Hui,YANG Wei-Jie. A Hierarchical Clustering Algorithm Based on Asymmetric Distance. , 2014, 27(5): 410-416.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2014/V27/I5/410
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn