模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2008, Vol. 21 Issue (4): 494-499    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
离散化方案的度量*
王立宏1,吴耿锋2
1.烟台大学 计算机科学与技术学院 烟台 264005
2.上海大学 计算机工程与技术学院 上海 200072
Measurements of Discretization Schemes
WANG Li-Hong1, WU Geng-Feng2
1.School of Computer Science and Technology, Yantai University, Yantai 2640052.
School of Computer Engineering and Technology, Shanghai University, Shanghai 200072

全文: PDF (385 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 分析数值决策表离散化方案的度量指标,包括断点数、条件信息熵、粒度熵、类-属性互信息、类-属性互相依赖冗余等.认为相容决策表的条件信息熵和类-属性互信息都是常数,对离散化方案不再有指导作用.讨论粒度熵与互相依赖冗余的关系,证明粒度熵随断点的加入而增加.设计实验度量这些指标之间的关系,实验发现,断点数和粒度熵与预测精度之间的相关程度不相上下,和具体的数据集有关.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
王立宏
吴耿锋
关键词 粒度熵离散化方案断点分类精度粗集    
Abstract:Several measurements of the discretization schemes for continuous decision tables are discussed, including cut-point number, conditional entropy, granular entropy, class-attribute mutual information and interdependence redundancy. For consistent decision table, conditional entropy and class-attribute mutual information are both constants, and thus they can not offer more information for discretization schemes. The relationship between granular entropy and interdependence redundancy is analyzed. And it is proved that granular entropy increases when new cut points are added to the discretization scheme. A hybrid discretization algorithm is proposed to provide discretization schemes for testing. The simulation results show that the correlation coefficient between the cut-point number and classification accuracy is basically equal to that between granular entropy and classification accuracy, and both of them are correlated to datasets.
Key wordsGranular Entropy    Discretization Scheme    Cut Point    Classification Accuracy    Rough Set   
收稿日期: 2006-11-19     
ZTFLH: TP181  
基金资助:国家自然科学基金(No.60772028)、山东省自然科学基金(No.Y2006G22)资助项目
作者简介: 王立宏,女,1970年生,教授,博士,主要研究方向为数据挖掘.E-mail:wanglh@ytu.edu.cn,wanglh_000@163.com.吴耿锋,男,1945年生,教授,博士生导师,主要研究方向为数据挖掘与知识发现、智能控制、智能信息处理和CSCW等.
引用本文:   
王立宏,吴耿锋. 离散化方案的度量*[J]. 模式识别与人工智能, 2008, 21(4): 494-499. WANG Li-Hong, WU Geng-Feng. Measurements of Discretization Schemes. , 2008, 21(4): 494-499.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2008/V21/I4/494
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn