模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (5): 745-754    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
主动协同半监督粗糙集分类模型
高灿,苗夺谦,张志飞,刘财辉
同济大学电子与信息工程学院计算机科学与技术系上海201804
同济大学嵌入式系统与服务计算教育部重点实验室上海201804
A Semi-Supervised Rough Set Model for Classification Based on Active Learning and Co-Training
GAO Can, MIAO Duo-Qian, ZHANG Zhi-Fei, LIU Cai-Hui
Department of Computer Science and Technology,College of Electronics and Information Engineering,Tongji University,Shanghai 201804
Key Laboratory of Embedded System and Service Computing,Ministry of Education,Tongji University,Shanghai 201804

全文: PDF (604 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 粗糙集理论是一种有监督学习模型,一般需要适量有标记的数据来训练分类器。但现实一些问题往往存在大量无标记的数据,而有标记数据由于标记代价过大较为稀少。文中结合主动学习和协同训练理论,提出一种可有效利用无标记数据提升分类性能的半监督粗糙集模型。该模型利用半监督属性约简算法提取两个差异性较大的约简构造基分类器,然后基于主动学习思想在无标记数据中选择两分类器分歧较大的样本进行人工标注,并将更新后的分类器交互协同学习。UCI数据集实验对比分析表明,该模型能明显提高分类学习性能,甚至能达到数据集的最优值。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
高灿
苗夺谦
张志飞
刘财辉
关键词 粗糙集差别矩阵半监督约简主动学习协同训练    
Abstract:Rough set theory, as an effective supervised learning model, usually relies on the availability of an amount of labeled data to train the classifier. Howerer, in many practical problems, large amount of unlabeled data are readily available, and labeled ones are fairly expensive to obtain because of high cost. In this paper, a semi-supervised rough set model is proposed to deal with the partially labeled data. The proposed model firstly employs two diverse semi-supervised reducts to train its base classifiers on labeled data. The unlabeled ramified samples for two base classifiers are selected to be labeled based on the principle of active learning, and then the updated classifiers learn from each other by labeling confident unlabeled samples to its concomitant. The experimental results on selected UCI datasets show that the proposed model greatly improves the classification performance of partially labeled data, and even the best performance of dataset is obtained.
Key wordsRough Set    Discernibility Matrix    Semi-Supervised Reduction    Active Learning    Co-Training   
收稿日期: 2011-06-20     
ZTFLH: TP181  
基金资助:国家自然科学基金项目(No.60970061,61075056,61103067)、中国博士后科学基金项目(No.2011M500626,2011M500815)、上海市重点学科建设项目(No.B004)资助
作者简介: 高灿,男,1983年生,博士研究生,主要研究方向为粒计算、机器学习等。E-mail:2005gaocan@163。com。苗夺谦,男,1964年生,教授,博士生导师,主要研究方向为粒计算、Web智能、机器学习等。张志飞,男,1986年生,博士研究生,主要研究方向为文本挖掘,机器学习等。刘财辉,男,1979年生,博士研究生,主要研究方向为粒计算、机器学习。
引用本文:   
高灿,苗夺谦,张志飞,刘财辉. 主动协同半监督粗糙集分类模型[J]. 模式识别与人工智能, 2012, 25(5): 745-754. GAO Can, MIAO Duo-Qian, ZHANG Zhi-Fei, LIU Cai-Hui. A Semi-Supervised Rough Set Model for Classification Based on Active Learning and Co-Training. , 2012, 25(5): 745-754.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I5/745
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn