模式识别与人工智能
2025年3月15日 星期六   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2018, Vol. 31 Issue (7): 643-652    DOI: 10.16451/j.cnki.issn1003-6059.201807007
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
模型决策树:一种决策树加速算法
尹儒1, 门昌骞1, 王文剑2, 刘澍泽3
1.山西大学 计算机与信息技术学院 太原 030006
2.山西大学 计算智能与中文信息处理教育部重点实验室 太原 030006
3.Department of Computer Science, Rensselaer Polytechnic Institute, Troy, NY 12180
Model Decision Tree: An Accelerated Algorithm of Decision Tree
YIN Ru1, MEN Changqian1, WANG Wenjian2, LIU Shuze3
1.School of Computer and Information Technology, Shanxi University, Taiyuan 030006
2.Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, Shanxi University, Taiyuan 030006
3.Department of Computer Science, Rensselaer Polytechnic Institute, Troy, NY 12180

全文: PDF (0 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 决策树算法采用递归方法构建,训练效率较低,过度分类的决策树可能产生过拟合现象.因此,文中提出模型决策树算法.首先在训练数据集上采用基尼指数递归生成一棵不完全决策树,然后使用一个简单分类模型对其中的非纯伪叶结点(非叶结点且结点包含的样本不属于同一类)进行分类,生成最终的决策树.相比原始的决策树算法,这样产生的模型决策树能在算法精度不损失或损失很小的情况下,提高决策树的训练效率.在标准数据集上的实验表明,文中提出的模型决策树在速度上明显优于决策树算法,具备一定的抗过拟合能力.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
尹儒
门昌骞
王文剑
刘澍泽
关键词 基尼指数决策树(DT)模型决策树分类    
Abstract:The decision tree algorithm is constructed in a recursive style. Therefore, the low training efficiency is yielded and the over-classification of decision tree may produce overfitting. An accelerated algorithm called model decision tree(MDT) is proposed in this paper. An incomplete classification decision tree is established via the Gini index on the training dataset firstly. Then a simple model is utilized to classify impure pseudo leaf nodes, which are neither leaf nodes nor in the same class. Consequently, the final MDT is generated. Compared with DT, MDT improves the training efficiency with smaller loss of classification accuracy or even no loss. The experimental results on benchmark datasets show that the proposed MDT is much faster than DT and it has a certain ability to avoid overfitting.
Key wordsGini Index    Decision Tree    Model Decision Tree    Classification   
收稿日期: 2018-04-15     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61673249)、山西省回国留学人员科研基金项目(No.2016-004)、赛尔网络下一代互联网技术创新项目(No.NGII20170601)
通讯作者: 王文剑(通讯作者),博士,教授,主要研究方向为机器学习、计算智能、图像处理等.E-mail:wjwang@sxu.edu.cn.   
作者简介: 尹 儒,硕士研究生,主要研究方向为机器学习.E-mail:1246819313@qq.com.门昌骞,博士,讲师,主要研究方向为支持向量机、机器学习理论、核方法.E-mail:menchangqian@sxu.edu.cn.刘澍泽,本科生.E-mail:lius17@rpi.edu.
引用本文:   
尹儒, 门昌骞, 王文剑, 刘澍泽. 模型决策树:一种决策树加速算法[J]. 模式识别与人工智能, 2018, 31(7): 643-652. YIN Ru, MEN Changqian, WANG Wenjian, LIU Shuze. Model Decision Tree: An Accelerated Algorithm of Decision Tree. , 2018, 31(7): 643-652.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201807007      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2018/V31/I7/643
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn