模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2011, Vol. 24 Issue (4): 591-600    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种融入可信度的集成SVM垃圾书签检测方法
张付志,周全强
燕山大学信息科学与工程学院秦皇岛066004
An Ensemble SVM Approach Integrated with Confidence for Detecting Bookmark Spam
Zhang Fu-Zhi, Zhou Quan-Qiang
School of Information Science and Engineering,YanShan University,Qinhuangdao 066004

全文: PDF (402 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对现有垃圾书签检测方法在用户概貌信息较少情况下检测性能下降的问题,提出一种融入可信度的集成SVM垃圾书签检测方法。首先基于Bootstrap技术对训练样本进行可重复采样,得到个体SVM的训练子集,然后将SVM的标准输出直接拟合Sigmoid函数得到SVM的后验概率输出,作为类别输出的可信度,并提出一种性能优于投票策略的融入可信度的融合方法对个体SVM的输出结果进行融合。实验结果表明,该方法在用户概貌信息较少的情况下具有较好的检测性能。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张付志
周全强
关键词 垃圾书签垃圾检测支持向量机可信度集成学习    
Abstract:The performance of existing methods for bookmark spam detection is decreased when there is less user profile information. An ensemble SVM approach integrated with confidence for detecting bookmark spam is proposed to solve this problem. The Bootstrap technology is firstly used to repeatedly sample the training data so as to get the subset of training samples for individual SVM. Then, sigmoid function is use to transform the standard output of SVM into a posterior probability which is used as the confidence of categories output. Finally, a method integrated with the confidence is proposed to aggregate the output of individual SVM, which is better than voting strategy. The experimental results show that the detection performance of the proposed approach outperforms the existing methods in the case of less user profile information.
Key wordsBookmark Spam    Spam Detection    Support Vector Machine    Confidence    Ensemble Learning   
收稿日期: 2010-05-24     
ZTFLH: TP391.1  
基金资助:国家973重点基础研究发展计划(No.2005CB321902)、河北省自然科学基金项目(No.F2008000877,F2011203219)、教育部科技发展中心网络时代的科技论文快速共享专项研究课题(No.20091333110011)资助
作者简介: 张付志,男,1964年生,教授、博士生导师,主要研究方向为智能网络信息处理、网络与信息安全、面向服务计算。E-mail:xjzfz@ysu。edu。cn。周全强,男,1985年生,博士研究生,主要研究方向为机器学习、智能网络信息处理。
引用本文:   
张付志,周全强. 一种融入可信度的集成SVM垃圾书签检测方法[J]. 模式识别与人工智能, 2011, 24(4): 591-600. Zhang Fu-Zhi, Zhou Quan-Qiang. An Ensemble SVM Approach Integrated with Confidence for Detecting Bookmark Spam. , 2011, 24(4): 591-600.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2011/V24/I4/591
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn