模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2018, Vol. 31 Issue (12): 1143-1150    DOI: 10.16451/j.cnki.issn1003-6059.201812010
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于词共现图的属性知识库迭代自增式扩展算法
李直旭1, 沈永新1, 陈嘉1, 刘安1, 赵朋朋1, 赵雷1
1.苏州大学 计算机科学与技术学院 215006
Iterative Bootstrapping Attribute Knowledge Base Extension Algorithm Based on Word Co-occurrence Graph
LI Zhixu1, SHEN Yongxin1, CHEN Jia1, LIU An1, ZHAO Pengpeng1, ZHAO Lei1
1.School of Computer Science and Technology, Soochow University, Suzhou 215006

全文: PDF (826 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 属性知识库扩展研究中已有的开放式信息抽取方法都十分依赖深度句法分析或有效的词典规则,在短文本处理上效果较差,召回率较低.文中提出基于词共现图的属性知识库迭代自增式扩展算法,利用属性与属性值的共现关系扩展知识库,并设计基于图的社区发现算法,找出社区的核心节点.最后,设计基于卷积神经网络的模型对抽取结果进行去噪.在两个真实数据集上的实验表明,文中方法在抽取质量上优于现有方法.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
李直旭
沈永新
陈嘉
刘安
赵朋朋
赵雷
关键词 开放式信息抽取属性知识库词共现图    
Abstract:Existing open information extraction methods in the attribute knowledge base extension heavily rely on deep syntax analysis or effective dictionary rules, thus the poor results in short text processing and low recall rates are produced. Therefore, an iterative bootstrapping attribute knowledge base extension algorithm based on word co-occurrence graph is proposed. The co-occurrence relationship between attribute and attribute values is employed to extend the knowledge base and a graph-based community discovery algorithm is designed to find out core nodes of the community. Finally, a model based on convolutional neural network is constructed to denoise the extraction results. Experiments on two real datasets show that the proposed method outperforms the existing ones.
Key wordsOpen Information Extraction    Attribute Knowledge Base    Word Co-occurrence Graph   
收稿日期: 2018-10-15     
ZTFLH: TP 182  
基金资助:国家自然科学基金项目(No.61632016,61402313,61472263)、江苏省高校自然科学基金项目(No.17KJA520003)资助
作者简介: 李直旭(通讯作者),博士,副教授,主要研究方向为数据智能、认知智能.E-mail:zhixuli@suda.edu.cn.
沈永新,硕士研究生,主要研究方向为信息抽取.E-mail:dixoshen@hotmail.com
陈 嘉,硕士研究生,主要研究方向为知识图谱、信息抽取.E-mail:jchen0812@suda.edu.cn.
刘 安,博士,副教授,主要研究方向为新兴应用的安全、隐私及信任问题.E-mail:anliu@suda.edu.cn.
赵朋朋,博士,副教授,主要研究方向为数据挖掘、移动智能、推荐系统、大数据分析.E-mail:ppzhao@suda.edu.cn.
赵 雷,博士,教授,主要研究方向为图数据库、社交媒体分析、查询外包和并行与分布式计算.E-mail:zhaol@suda.edu.cn.
引用本文:   
李直旭, 沈永新, 陈嘉, 刘安, 赵朋朋, 赵雷. 基于词共现图的属性知识库迭代自增式扩展算法[J]. 模式识别与人工智能, 2018, 31(12): 1143-1150. LI Zhixu, SHEN Yongxin, CHEN Jia, LIU An, ZHAO Pengpeng, ZHAO Lei. Iterative Bootstrapping Attribute Knowledge Base Extension Algorithm Based on Word Co-occurrence Graph. , 2018, 31(12): 1143-1150.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201812010      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2018/V31/I12/1143
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn