模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (11): 995-1003    DOI: 10.16451/j.cnki.issn1003-6059.202011004
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于生成式-判别式混合模型的可解释性文档分类
王强1,2,3, 陈志豪1,2,3, 徐庆1,2,3, 鲍亮1,2,3, 廖祥文1,2,3
1.福州大学 数学与计算机科学学院 福州 350116;
2.福州大学 福建省网络计算与智能信息处理重点实验室 福州 350116;
3.福州大学 数字福建金融大数据研究所 福州 350116
Interpretability Document Classification Based on Generative-Discriminatory Hybrid Model
WANG Qiang1,2,3, CHEN Zhihao1,2,3, XU Qing1,2,3, BAO Liang1,2,3, LIAO Xiangwen1,2,3
1. College of Mathematics and Computer Science,Fuzhou University,Fuzhou 350116;
2. Fujian Provincial Key Laboratory of Networking Computing and Intelligent Information Processing,Fuzhou University,Fuzhou 350116;
3. Digital Fujian Institute of Financial Big Data,Fuzhou University,Fuzhou 350116

全文: PDF (785 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 现有可解释性文档分类常忽略对文本信息的深度挖掘,未考虑单词与单词上下文、句子与句子上下文之间的语义关系.为此,文中提出基于生成式-判别式混合模型的可解释性文档分类方法,在文档编码器中引入分层注意力机制,获得富含上下文语义信息的文档表示,生成精确的分类结果及解释性信息,解决现有模型对文本信息挖掘不够充分的问题.在PCMag、Skytrax评论数据集上的实验表明,文中方法在文档分类上性能较优,生成较准确的解释性信息,提升方法的整体性能.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
王强
陈志豪
徐庆
鲍亮
廖祥文
关键词 可解释性分层注意力机制文本分类文本摘要视角级情感分类    
Abstract:The deep mining of text information and the semantic relationships between word and word context and between sentence and sentence context are not taken into account in the existing interpretability document classification.Therefore,an interpretable document classification method based on a generative-discriminatory-hybrid model is proposed.The hierarchical attention mechanism is introduced into the document encoder to obtain the document representations rich in contextual semantic information.And thus more accurate classification results and explanatory information are generated,and the problem of insufficient text information mining in the existing models is handled.Experiments on PCMag and Skytrax comment datasets show that the proposed method has better performance in document classification,generates more accurate explanatory information and improves the overall performance of the method.
Key wordsInterpretability    Hierarchical Attention Mechanism    Document Classification    Text Summarization    Aspect Level Sentiment Classification   
收稿日期: 2020-07-02     
ZTFLH: TP391  
基金资助:国家自然科学基金项目(No.61772135,U1605251)、国家自然科学基金青年基金项目(No.41801324)、福建省自然科学基金面上项目(No.2017J01755)、模式识别国家重点实验室开放课题基金项目(No.201900041)资助
通讯作者: 廖祥文,博士,教授,主要研究方向为观点挖掘、情感分析、自然语言处理.E-mail:liaoxw@fzu.edu.cn.   
作者简介: 王强,硕士研究生,主要研究方向为可解释性分析、情感分析、自然语言处理.E-mail:n180320065@fzu.edu.cn.陈志豪,博士研究生,主要研究方向为社交网络信息传播、情感分析.E-mail:n180320046@fzu.edu.cn.徐庆,硕士研究生,主要研究方向为知识图谱、情感分析.E-mail:328323374@qq.com.鲍亮,硕士研究生,主要研究方向为机器阅读理解、自然语言处理.E-mail:825549829@qq.com.
引用本文:   
王强, 陈志豪, 徐庆, 鲍亮, 廖祥文. 基于生成式-判别式混合模型的可解释性文档分类[J]. 模式识别与人工智能, 2020, 33(11): 995-1003. WANG Qiang, CHEN Zhihao, XU Qing, BAO Liang, LIAO Xiangwen. Interpretability Document Classification Based on Generative-Discriminatory Hybrid Model. , 2020, 33(11): 995-1003.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202011004      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I11/995
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn