模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2011, Vol. 24 Issue (6): 792-797    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
多变量连续属性离散化方法
侯居茌1,梁莹2,任长志3
1.河北工程大学学生工作部邯郸056038
2.南京大学社会学院社会工作与社会政策系南京210093
3.清华大学精密仪器与机械学系北京100084
A Multivariate Discretization Method for Continuous Attributes
HOU Ju-Chi1, LIANG Ying2, REN Chang-Zhi3
1.Department of Student Affairs, Hebei University of Engineering, Hebei 056038
2.Department of Social Work and Social Policy, School of Social and Behavioral Sciences, Nanjing University, Nanjing 210093
3.Department of Precision Instruments and Mechanology, Tsinghua University, Beijing 100084

全文: PDF (538 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 目前很多离散化方法仅考虑单个变量,不能得到最优的离散化方案。文中提出一种多属性关系的数据离散化方法。凭借概率的模型选择和最小描述长度原理,获得多变量离散化衡量标准,基于该标准提出一种有效的启发式算法来寻找最好的离散化方案。对UCI数据集进行分类预测,实验结果表明该方法提高Nave贝叶斯分类器的学习精度。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
侯居茌
梁莹
任长志
关键词 数据挖掘多变量离散化最小描述长度原理(MDLP)Nave贝叶斯分类器    
Abstract:Currently, most discretization methods only consider a single variable, which can not get optimal discretization scheme. Taking the relationship among multi-attributes into account, a data discretization method is proposed. A multivariate discretization measurement criterion is presented by means of probabilistic model selection and minimum description length principle (MDLP). An efficient heuristic algorithm is proposed to get the best discretization scheme based on the proposed criterion. Nine UCI datasets are classified and predicted. Experimental results show that the proposed method significantly enhances the learning accuracy of Nave Bayes classifier.
Key wordsData Mining    Multivariate Discretization    Minimum Description Length Principle (MDLP)    Nave Bayes Classifier   
收稿日期: 2010-12-06     
ZTFLH: TP181  
基金资助:国家自然科学基金项目(No.71173099)、国家自然科学基金青年项目(No.70903002)资助
作者简介: 侯居茌,男,1976年生,讲师,主要研究方向为数据挖掘、模式识别等.梁莹,女,1979年生,副教授,主要研究方向为公共管理、数据挖掘等.E-mail:njulucy@163.com.任长志,男,1977年生,博士后,副研究员,主要研究方向为智能控制、数据挖掘、模式识别等.
引用本文:   
侯居茌,梁莹,任长志. 多变量连续属性离散化方法[J]. 模式识别与人工智能, 2011, 24(6): 792-797. HOU Ju-Chi, LIANG Ying, REN Chang-Zhi. A Multivariate Discretization Method for Continuous Attributes. , 2011, 24(6): 792-797.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2011/V24/I6/792
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn