模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2017, Vol. 30 Issue (3): 242-250    DOI: 10.16451/j.cnki.issn1003-6059.201703006
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于二次学习的半监督字典学习软件缺陷预测*
张志武1,荆晓远1,2,吴飞3
1.南京邮电大学 计算机学院 南京 210023
2.武汉大学 软件工程国家重点实验室 武汉 430072
3.南京邮电大学 自动化学院 南京 210023
Twice Learning Based Semi-supervised Dictionary Learning for Software Defect Prediction
ZHANG Zhiwu1, JING Xiaoyuan1,2, WU Fei3
1.School of Computer, Nanjing University of Posts and Telecommunications, Nanjing 210023
2.State Key Laboratory of Software Engineering, Wuhan University, Wuhan 430072
3.School of Automation, Nanjing University of Posts and Telecommunications, Nanjing 210023

全文: PDF (712 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 当软件历史仓库中有标记训练样本较少时,有效的预测模型难以构建.针对此问题,文中提出基于二次学习的半监督字典学习软件缺陷预测方法.在第一阶段的学习中,利用稀疏表示分类器将大量无标记样本通过概率软标记标注扩充至有标记训练样本集中.再在扩充后的训练集上进行第二阶段的鉴别字典学习,最后在学得的字典上预测缺陷倾向性.在NASA MDP和PROMISE AR数据集上的实验验证文中方法的优越性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张志武
荆晓远
吴飞
关键词 软件缺陷预测 二次学习 半监督学习 字典学习    
Abstract:When the previous defect labels of modules in software history warehouse are limited, building an effective prediction model becomes a challenging problem. Aiming at this problem, a twice learning based semi-supervised learning algorithm for software defect prediction is proposed. In the first stage of learning, a large number of unlabeled samples are labeled with probability soft labels and extended to the labeled training dataset by using sparse representation classifier. Then, on this dataset discriminative dictionary learning is used for the second stage of learning. Finally, defect proneness prediction is conducted on the obtained dictionary. Experiments on the widely used NASA MDP and PROMISE AR datasets indicate the superiority of the proposed algorithm.
Key wordsSoftware Defect Prediction    Twice Learning    Semi-supervised Learning    Dictionary Learning   
收稿日期: 2016-07-28     
ZTFLH: TP 311  
基金资助:国家自然科学基金项目(No.61272273,61073113)、江苏省普通高校研究生科研创新计划项目(No.CXZZ12_0478)资助
作者简介: 张志武,男,1981年生,博士研究生,主要研究方向为模式识别、机器学习、软件工程.E-mail:zhangzw@njupt.edu.cn.
荆晓远(通讯作者),男,1971年生,博士,教授,主要研究方向为模式识别、机器学习、软件工程.E-mail:jingxy_2000@126.com.
吴 飞,男,1989年生,博士,讲师,主要研究方向为模式识别、机器学习、软件工程.E-mail:wufei_8888@126.com.
引用本文:   
张志武,荆晓远,吴飞. 基于二次学习的半监督字典学习软件缺陷预测*[J]. 模式识别与人工智能, 2017, 30(3): 242-250. ZHANG Zhiwu, JING Xiaoyuan, WU Fei. Twice Learning Based Semi-supervised Dictionary Learning for Software Defect Prediction. , 2017, 30(3): 242-250.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201703006      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2017/V30/I3/242
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn