模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2018, Vol. 31 Issue (3): 265-274    DOI: 10.16451/j.cnki.issn1003-6059.201803008
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于区间2-型模糊度量的粗糙K-means聚类算法*
逯瑞强1, 马福民1, 张腾飞2
1.南京财经大学 信息工程学院 南京 210023
2.南京邮电大学 自动化学院 南京 210023
Interval Type-2 Fuzzy Measure Based Rough K-means Clustering
LU Ruiqiang1, MA Fumin1, ZHANG Tengfei2
1.College of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210023
2.College of Automation, Nanjing University of Posts and Telecommunications, Nanjing 210023

全文: PDF (823 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

现有粗糙K-means聚类算法及系列改进、衍生算法均是从不同角度描述交叉类簇边界区域中的不确定性数据对象,却忽视类簇间规模的不均衡对聚类迭代过程及结果的影响.文中引入区间2-型模糊集的概念度量类簇的边界区域数据对象,提出基于区间2-型模糊度量的粗糙K-means聚类算法.首先根据类簇的数据分布生成边界区域样本对交叉类簇的隶属度区间,体现数据样本的空间分布信息.然后进一步考虑类簇的数据样本规模,在隶属度区间的基础上自适应地调整边界区域的样本对交叉类簇的影响系数.文中算法削弱边界区域对较小规模类簇的中心均值迭代的不利影响,提高聚类精度.在人工数据集及UCI标准数据集的测试分析验证算法的有效性.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
逯瑞强
马福民
张腾飞
关键词 粗糙聚类K-means区间2-型模糊度量粗糙集    
Abstract

The rough k-means algorithm and its derivatives focus on the description of data objects in uncertain boundary areas. However, the influence of imbalanced sizes between clusters on the clustering result is ignored. The interval type-2 fuzzy measure is introduced in this paper for measuring the boundary objects and an improved rough K-means clustering algorithm is developed. Firstly, the membership degree interval of the boundary object is calculated according to the data distribution of clusters and thus the spatial distribution of clusters is described. Then, the data sample size of the cluster is taken into account to adaptively adjust the influence coefficient of boundary objects on overlapping clusters. The experimental results on both synthetic and UCI datasets show that the adverse impact of the boundary objects on the means iterative calculations of small sample size clusters is mitigated and the clustering accuracy is improved.

Key wordsRough Clustering    K-means    Interval Type-2 Fuzzy Measure    Rough Sets   
收稿日期: 2017-06-03     
ZTFLH: TP 18  
基金资助:

国家自然科学基金项目(No.61403184,61105082)、江苏省高校自然科学研究重大项目(No.17KJA120001)、江苏省“青蓝工程”项目(No.QL2016)、江苏高校优势学科建设工程项目(PAPD)、国家电子商务信息处理国际联合研究中心项目(No.2013B01035)、南京邮电大学“1311人才计划”基金(No.NY2013)资助

通讯作者: 马福民,女,博士,副教授,主要研究方向为智能信息处理、智能生产系统等.E-mail:fmmatj@126.com.   
作者简介: 逯瑞强,男,硕士研究生,主要研究方向为信息处理、数据挖掘.E-mail:15005184504@163.com.张腾飞,男,博士,教授,主要研究方向为智能信息处理、大数据分析等.E-mail:tfzhang@126.com.
引用本文:   
逯瑞强, 马福民, 张腾飞. 基于区间2-型模糊度量的粗糙K-means聚类算法*[J]. 模式识别与人工智能, 2018, 31(3): 265-274. LU Ruiqiang, MA Fumin, ZHANG Tengfei. Interval Type-2 Fuzzy Measure Based Rough K-means Clustering. , 2018, 31(3): 265-274.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201803008      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2018/V31/I3/265
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn