模式识别与人工智能
2025年1月11日 星期六   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2013, Vol. 26 Issue (11): 1068-1072    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
面向跨领域情感分类的特征选择方法
张玉红,周,全,胡学钢
合肥工业大学计算机与信息学院合肥230009
Feature Selection for Cross-Domain Sentiment Classification
ZHANG Yu-Hong,ZHOU Quan,HU Xue-Gang
School of Computer and Information,Hefei University of Technology,Hefei 230009

全文: PDF (429 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 数据标记的难以获取使得跨领域适应成为一种有效的途径.然而情感分类具有较强的领域依赖性,利用传统的特征选择方法在原始领域构建的特征空间不能体现领域间的共性,难以适用于目标领域.为此,提出一种面向跨领域情感分类的特征选择方法(LLRTF),利用对数似然比选取在原始领域富有判别力的特征,并通过对照两个领域的统计信息,选出其中在目标领域影响较大的特征.基于该方法构建的公共特征空间,能减少领域间数据分布的差异.实验结果表明,LLRTF优于基准算法.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 特征选择跨领域情感分类    
Abstract:The data is usually unlabeled in application,which makes the adaptation of cross-domain effective. However,the sentiment classification is domain-dependent. The feature space of source domain,gotten by feature selection,can not represent the common character of both domains and is not suitable for the classification of target domain. Therefore,an approach of feature selection for cross-domain sentiment classification,Log-Likelihood Ratio-Term Frequency (LLRTF) is proposed. The log likelihood ratios (LLR) of features are computed in source domain,by which the discriminative feature space is gotten. Then,the statistic information term frequency of both domains is added to the LLR,and the features which are more important in target domain are selected. The feature space construction based on the LLRTF reduces the difference between source domain and target domain. The experimental result shows that the LLRTF is superior to the baselines.
Key wordsFeature Selection    Cross-Domain    Sentiment Classification   
收稿日期: 2013-02-05     
ZTFLH: TP181  
基金资助:国家自然科学基金项目(No.61273292,61273297)、国家863计划项目(No.2012AA011005)、安徽省自然科学基金项目(No.1208085QF122)资助
作者简介: 张玉红(通讯作者),女,1979年生,博士,主要研究方向为数据挖掘、机器学习.E-mail:zhangyh@hfut.edu.cn.周全,男,1988年生,硕士研究生,主要研究方向为机器学习.胡学钢,男,1961年生,教授,博士生导师,主要研究方向为数据挖掘、智能计算.E-mail:jsjxhuxg@hfut.edu.cn.
引用本文:   
张玉红,周,全,胡学钢. 面向跨领域情感分类的特征选择方法[J]. 模式识别与人工智能, 2013, 26(11): 1068-1072. ZHANG Yu-Hong,ZHOU Quan,HU Xue-Gang. Feature Selection for Cross-Domain Sentiment Classification. , 2013, 26(11): 1068-1072.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2013/V26/I11/1068
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn