模式识别与人工智能
2025年4月13日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2011, Vol. 24 Issue (1): 103-110    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
面向层次分类的文本特征选择方法
祝翠玲1,2,马军1,张冬梅1
1.山东大学计算机科学与技术学院济南250101
2.山东经济学院信息管理学院济南250014
Text Feature Selection Method for Hierarchical Classification
ZHU Cui-Ling1,2, MA Jun1, ZHANG Dong-Mei1
1.School of Computer Science and Technology, Shandong University, Jinan 250101
2.School of Information Management, Shandong Economic University, Jinan 250014

全文: PDF (515 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出一种针对层次分类的文本特征选择方法。先给出类别层次相关度的概念,并利用分类树和训练数据在不同层次上的概率分布进行计算,进而得到分类树中不同类别的重要性。最后基于前面的计算结果,计算每个特征对类别的识别能力,并选择识别能力大的特征组成用于分类的特征集合。实验表明该方法在选取的特征质量以及在accuracy、F1和micro-Precision等分类测度上均优于传统方法。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
祝翠玲
马军
张冬梅
关键词 文本特征选择类别层次相关层次分类机器学习    
Abstract:An approach of feature selection for hierarchical classification is proposed. Firstly, the concept of category hierarchical correlation degree is introduced and it is calculated according to the category tree and the probability distribution of training data on different levels. Then, the importance degrees of categories are computed according to hierarchical correlation degree. Finally, the discriminative abilities of features are calculated based on the previous computation and the features with the greater discriminative ability are chosen as the feature set for classification. Experimental results show that the proposed approach outperforms the traditional feature selection methods on both quality of the features selected and standard classification metrics in terms of accuracy, F1 and micro-precision.
Key wordsText Feature Selection    Category Hierarchical Correlation    Hierarchical Classification    Machine Learning   
收稿日期: 2010-01-21     
ZTFLH: TP391.4  
基金资助:国家自然科学基金项目(No.60970047)、山东省自然科学基金项目(No.Y2008G19)和山东省科技攻关项目(No.2007GG10001002,2008GG10001026)资助
作者简介: 祝翠玲,女,1979年生,博士研究生,讲师,主要研究方向为层次分类、Web挖掘和特征提取.E-mail:cuiling_zhu@163.com.马军,男,1956年生,教授,博士生导师,主要研究方向为信息检索、并行计算、算法分析与设计.E-mail:majun@sdu.edu.cn.张冬梅,女,1970年生,博士研究生,副教授,主要研究方向为情感分析、语义网络和分类.
引用本文:   
祝翠玲,马军,张冬梅. 面向层次分类的文本特征选择方法[J]. 模式识别与人工智能, 2011, 24(1): 103-110. ZHU Cui-Ling, MA Jun, ZHANG Dong-Mei. Text Feature Selection Method for Hierarchical Classification. , 2011, 24(1): 103-110.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2011/V24/I1/103
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn