模式识别与人工智能
2025年4月13日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2014, Vol. 27 Issue (12): 1138-1146    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
不平衡数据学习算法在相似性学习中的应用*
夏佩佩,张莉
苏州大学 计算机科学与技术学院 苏州 215006
Application of Imbalanced Data Learning Algorithms to Similarity Learning
XIA Pei-Pei, ZHANG Li
School of Computer Science and Technology, Soochow University, Suzhou 215006

全文: PDF (582 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

在现实问题中,相似性学习的样本对存在不平衡现象,即相似性样本对的数量会远小于不相似性样本对的数量.针对此问题,文中提出两种样本对构造方法——不相似K近邻-相似K近邻(DKNN-SKNN)和不相似K近邻-相似K远邻(DKNN-SKFN).运用这两种方法可有针对性地选择相似性学习样本对,不仅可加快支持向量机的训练过程,而且在一定程度上解决样本对之间的不平衡问题.在多个数据集上进行文中方法和经典的重采样方法的对比实验,结果表明DKNN-SKNN和DKNN-SKFN具有良好性能.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
夏佩佩
张莉
关键词 相似性学习支持向量机K近邻不平衡学习重采样    
Abstract

In the real-world problems, there is an imbalance in the paired-samples. The number of the paired-samples in similarity set is much smaller than the number of the paired-samples in dissimilarity set. To solve this problem, two approaches, dissimilar K nearest neighbor and similar K nearest neighbor (DKNN-SKNN) and dissimilar K nearest neighbor and similar K farthest neighbor (DKNN-SKFN), are proposed to construct paired-samples. Thus, the number of paired-samples in similarity learning is effectively decreased, the training process of SVM is accelerated, and the imbalanced data problem is solved to some degree. In the experiments, the proposed approaches are compared with some standard resampling methods. The results show that the proposed approaches have better performance.

Key wordsSimilarity Learning    Support Vector Machine    K Nearest Neighbor    Imbalanced Data Learning    Resampling   
收稿日期: 2013-07-26     
ZTFLH: TP181  
基金资助:

国家自然科学基金项目(No.61373093,61033013)、江苏省自然科学基金项目No.BK2011284,BK201222725,BK20140008)、江苏省高校自然科学研究项目(No.13KJA520001)、江苏省青蓝工程项目资助

作者简介: 夏佩佩,女,1989年生,硕士研究生,主要研究方向为模式识别、机器学习.E-mail:20124227054@suda.edu.cn.张莉(通讯作者),女,1975年生,博士,教授,主要研究方向为模式识别、机器学习、信号处理.E-mail:zhangliml@suda.edu.cn.
引用本文:   
夏佩佩,张莉. 不平衡数据学习算法在相似性学习中的应用*[J]. 模式识别与人工智能, 2014, 27(12): 1138-1146. XIA Pei-Pei, ZHANG Li. Application of Imbalanced Data Learning Algorithms to Similarity Learning. , 2014, 27(12): 1138-1146.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2014/V27/I12/1138
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn