模式识别与人工智能
2025年4月5日 星期六   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2019, Vol. 32 Issue (9): 785-792    DOI: 10.16451/j.cnki.issn1003-6059.201909002
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
面向多标签文本分类的深度主题特征提取
陈文实1, 刘心惠1, 鲁明羽1
1.大连海事大学 信息科学技术学院 大连 116026
Feature Extraction of Deep Topic Model for Multi-label Text Classification
CHEN Wenshi1, LIU Xinhui1, LU Mingyu1
1.College of Information Science and Technology, Dalian Maritime University, Dalian 116026

全文: PDF (644 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对单标签特征提取方法不能有效解决多标签文本分类的问题,文中提出融合主题模型(LDA)与长短时记忆网络(LSTM)的双通道深度主题特征提取模型(DTFEM).LDA与LSTM分别作为两个通道,通过LDA为文本的全局特征建模,利用LSTM为文本的局部特征建模,使模型能同时表达文本的全局特征和局部特征,实现有监督学习与无监督学习的有效结合,得到文本不同层次的特征提取.实验表明,相比文本特征提取模型,文中模型在多标签分类结果上的多项指标均有明显提升.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈文实
刘心惠
鲁明羽
关键词 多标签文本分类深度主题特征提取主题模型长短时记忆网络    
Abstract:Traditional single-label feature extraction methods cannot effectively solve the problem of multi-label text classification. Aiming at this problem, a dual model of latent dirichlet allocation(LDA) and long short-term memory(LSTM), deep topic feature extraction model(DTFEM), is proposed in this paper. LDA and LSTM are employed as two channels, respectively. LDA is used to model global features of the text, and LSTM is used to model local features of the text. DTFEM can express the global and local features of the text simultaneously and combine supervised learning and unsupervised learning effectively to realize the feature extraction of different levels of text. Experimental results show that DTFEM is superior to other traditional text feature extraction models and obviously improves the indicators of multi-label text classification tasks.
Key wordsMulti-label Text Classification    Deep Topic Feature Extraction    Topic Model    Long Short-Term Memory Network   
收稿日期: 2019-05-15     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61073133,61272369)资助
通讯作者: 鲁明羽,博士,教授,主要研究方向为数据挖掘、模式识别、机器学习、自然语言处理.E-mail:lumingyu@dlmu.edu.cn.   
作者简介: 陈文实,博士研究生,副教授,主要研究方向为自然语言处理、文本分类.E-mail:lnjzcws@sohu.com;刘心惠,硕士研究生,主要研究方向为自然语言处理、文本分类.E-mail:xinhuiliu2017@163.com.
引用本文:   
陈文实, 刘心惠, 鲁明羽. 面向多标签文本分类的深度主题特征提取[J]. 模式识别与人工智能, 2019, 32(9): 785-792. CHEN Wenshi, LIU Xinhui, LU Mingyu. Feature Extraction of Deep Topic Model for Multi-label Text Classification. , 2019, 32(9): 785-792.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201909002      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2019/V32/I9/785
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn