模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (3): 367-374    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于热传导模型的更新摘要算法
杜攀,郭嘉丰,张瑾,程学旗,张旭
中国科学院计算技术研究所网络数据科学与工程研究中心北京100190
Update Summarization Based on Heat Conduction Model
DU Pan, GUO Jia-Feng, ZHANG Jin, CHENG Xue-Qi, ZHANG Xu
Research Center of Web Data Science and Engineering,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190

全文: PDF (440 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 更新摘要除了要解决传统的面向话题的多文档摘要的两个要求——话题相关性和信息多样性,还要求应对用户对信息新颖性的需求。文中为更新摘要提出一种基于热传导模型的抽取式摘要算法——HeatSum。该方法能够自然利用句子与话题,新句子和旧句子,以及已选句子和待选句子之间的关系,并且为更新摘要找出话题相关、信息多样且内容新颖的句子。实验结果表明,HeatSum与参加TAC09评测的表现最好的抽取式方法性能相当,且更优于其它基准方法。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
杜攀
郭嘉丰
张瑾
程学旗
张旭
关键词 更新摘要面向话题的多文档摘要热传导模型    
Abstract:Besides the problems of topic relevance and information diversity tackled by traditional topic-focused multi-document summarization, the update summarization is required to address the problem of information novelty as well. In this paper, HeatSum, an extractive approach based on heat conduction for update summarization, is proposed. The process can naturally make use of the relationships among the given topic, the old sentences, the new sentences, and the sentences selected and to be selected to find proper sentences for update summarization. Therefore, HeatSum is able to simultaneously address the challenging problems above for update summarization in a unified way. The experiments on benchmark of TAC2009 are performed and the ROUGE evaluation results show that the HeatSum achieves fine performance compared to the best existing performing systems in TAC tasks and it significantly outperforms other baseline methods.
Key wordsUpdate Summarization    Topic-Oriented Multi-Document Summarization    Heat Conduction Model   
收稿日期: 2010-10-13     
ZTFLH: TP391  
基金资助:国家自然科学基金重点项目(No.60933005)、国家自然科学基金项目(No.60903139,61003166)和国家863计划项目(No.2010AA012500)资助
作者简介: 杜攀,男,1981年生,博士,主要研究方向为网络挖掘。E-mail:xiaopandu@gmail。com。郭嘉丰,男,1980年生,博士,主要研究方向为社会搜索、网络挖掘、信息检索。张瑾,男,1978年生,博士,主要研究方向为文本挖掘、自动文摘。程学旗,男,1971年生,博士,研究员,主要研究方向为网络科学、网络搜索与数据挖掘、P2P与分布式系统、信息安全。张旭,女,1983年生,硕士,主要研究方向为视频内容分析与检索。
引用本文:   
杜攀,郭嘉丰,张瑾,程学旗,张旭. 基于热传导模型的更新摘要算法[J]. 模式识别与人工智能, 2012, 25(3): 367-374. DU Pan, GUO Jia-Feng, ZHANG Jin, CHENG Xue-Qi, ZHANG Xu. Update Summarization Based on Heat Conduction Model. , 2012, 25(3): 367-374.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I3/367
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn