模式识别与人工智能
2025年1月12日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (6): 518-529    DOI: 10.16451/j.cnki.issn1003-6059.202006005
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
近邻感知的标签噪声过滤算法
姜高霞1, 樊瑞宣1, 王文剑1,2
1.山西大学 计算机与信息技术学院 太原 030006
2.山西大学 计算智能与中文信息处理教育部重点实验室 太原 030006
Label Noise Filtering via Perception of Nearest Neighbors
JIANG Gaoxia1, FAN Ruixuan1, WANG Wenjian1,2
1. School of Computer and Information Technology, Shanxi University, Taiyuan 030006
2. Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education, Shanxi University, Taiyuan 030006

全文: PDF (763 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 基于k近邻的标签噪声过滤对近邻参数k的选取较敏感.针对此问题,文中提出近邻感知的标签噪声过滤算法,可有效解决二分类数据集的类内标签噪声的问题.算法分开考虑正类样本和负类样本,使分类问题中的标签噪声检测问题转化为两个单类别数据的离群点检测问题.首先通过近邻感知策略自动确定每个样本的个性化近邻参数,避免近邻参数敏感的问题.然后根据噪声因子将样本分为核心样本与非核心样本,并把非核心样本作为标签噪声候选集.最后结合候选样本的近邻标签信息,进行噪声的识别与过滤.实验表明,文中方法的噪声过滤效果和分类预测性能均较优.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
姜高霞
樊瑞宣
王文剑
关键词 标签噪声过滤近邻感知个性化k近邻离群点检测噪声因子    
Abstract:Label noise filtering algorithms based on k nearest neighbor are sensitive to the neighbor parameter k. Aiming at this problem, a label noise filtering algorithm based on perception of nearest neighbors(PNN) is proposed to solve the problem of intra-class label noise in binary classification datasets effectively. Positive and negative samples are considered separately in PNN, and thus the label noise detection problem in classification is transformed into two outlier detection problems with single-class data. Firstly, the personalized neighbor parameter is determined automatically by the neighbor perception strategy to avoid the sensitivity of neighbor parameter. Secondly, all samples are divided into core samples and non-core samples by noise factor. The non-core samples are taken as the candidates of label noise. Finally, the noise is identified and filtered by combining the label information of the nearest neighbors of the candidate samples. Experiments indicate that the proposed algorithm performs well in noise filtering and classification prediction.
Key wordsLabel Noise Filtering    Perception of Nearest Neighbors    Personalized k-Nearest Neighbor    Outlier Detection    Noise Factor   
收稿日期: 2020-06-12     
ZTFLH: TP 181  
基金资助:国家自然科学基金项目(No.61673249,U1805263,61906113)、山西省国际合作重点研发计划项目(No.201903D421050)、山西省高等学校科技创新项目(No.2020L0007)资助
通讯作者: 王文剑,博士,教授,主要研究方向为机器学习、计算智能等.E-mail:wjwang@sxu.edu.cn.   
作者简介: 姜高霞,博士,讲师,主要研究方向为机器学习、数据挖掘.E-mail:jianggaoxia@sxu.edu.cn. 樊瑞宣,硕士研究生,主要研究方向为机器学习.E-mail:835717990@qq.com.
引用本文:   
姜高霞, 樊瑞宣, 王文剑. 近邻感知的标签噪声过滤算法[J]. 模式识别与人工智能, 2020, 33(6): 518-529. JIANG Gaoxia, FAN Ruixuan, WANG Wenjian. Label Noise Filtering via Perception of Nearest Neighbors. , 2020, 33(6): 518-529.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202006005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I6/518
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn