模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2017, Vol. 30 Issue (7): 646-652    DOI: 10.16451/j.cnki.issn1003-6059.201707007
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于半监督集成学习的软件缺陷预测*
王铁建1,吴飞2,荆晓远1
1.武汉大学 计算机学院 软件工程国家重点实验室 武汉 430072
2.南京邮电大学 自动化学院 南京 210023
Semi-supervised Ensemble Learning Based Software Defect Prediction
WANG Tiejian1, WU Fei2, JING Xiaoyuan1
1.State Key Laboratory of Software Engineering, School of Computer, Wuhan University, Wuhan 430072
2.School of Automation, Nanjing University of Posts and Telecommunications, Nanjing 210023

全文: PDF (638 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在软件缺陷预测中,标记样本不足与类不平衡问题会影响预测结果.为了解决这些问题,文中提出基于半监督集成学习的软件缺陷预测方法.该方法利用大量存在的未标记样本进行学习,得到较好的分类器,同时能集成一系列弱分类器,减少多数类数据对预测产生的偏倚.考虑到预测风险成本问题,文中还采用训练样本集权重向量更新策略,降低有缺陷模块预测为无缺陷模块的风险.在NASA MDP数据集上的对比实验表明,文中方法具有较好的预测效果.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
王铁建
吴飞
荆晓远
关键词 软件缺陷预测类不平衡半监督学习集成学习    
Abstract:The software defect prediction is usually adversely affected by the limitation of the labeled modules and the class-imbalance of software defect data. Aiming at this problem, a semi-supervised ensemble learning software defect prediction approach is proposed. High-performance classifiers can be built through semi-supervised ensemble learning by using a large amount of unlabeled modules and a better prediction capability is achieved for class-imbalanced data by using a series of weak classifiers to reduce the bias generated by the majority class. With the consideration of the cost of risk in software defect prediction, a sample weight vector updating strategy is employed to reduce the cost of risk caused by misclassifying defective modules as non-defective ones. Experimental results on NASA MDP datasets show better software defect prediction capability of the proposed approach.
Key wordsSoftware Defect Prediction    Class-Imbalance    Semi-supervised Learning    Ensemble Learning   
收稿日期: 2016-10-20     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61272273)资助
作者简介: 王铁建,男,1982年生,博士研究生,主要研究方向为模式识别、机器学习、软件工程.E-mail:wangtiejian1116@sina.com.
吴 飞,男,1989年生,博士,讲师,主要研究方向为模式识别、机器学习、软件工程.E-mail:wufei_8888@126.com.
荆晓远(通讯作者),男,1971年生,博士,教授,主要研究方向为模式识别、机器学习、软件工程.E-mail:jingxy_2000@126.com.
引用本文:   
王铁建,吴飞,荆晓远. 基于半监督集成学习的软件缺陷预测*[J]. 模式识别与人工智能, 2017, 30(7): 646-652. WANG Tiejian, WU Fei, JING Xiaoyuan. Semi-supervised Ensemble Learning Based Software Defect Prediction. , 2017, 30(7): 646-652.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201707007      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2017/V30/I7/646
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn