模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2024, Vol. 37 Issue (8): 715-728    DOI: 10.16451/j.cnki.issn1003-6059.202408005
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
故事启发大语言模型的时序知识图谱预测
陈娟1,2, 赵新潮3, 隋京言1,2, 祁麟4, 田辰4, 庞亮1,2, 方金云1
1.中国科学院计算技术研究所 前瞻研究实验室 北京 100190;
2.中国科学院大学 计算机科学与技术学院 北京 100049;
3.中科大数据研究院 兰亭中心 郑州 450046;
4.北京交通大学 软件学院 北京 100044
Narrative-Driven Large Language Model for Temporal Knowledge Graph Prediction
CHEN Juan1,2, ZHAO Xinchao3, SUI Jingyan1,2, QI Lin4, TIAN Chen4, PANG Liang1,2, FANG Jinyun1
1. Prospective Research Laboratory, Institute of Computing Te-chnology, Chinese Academy of Sciences, Beijing 100190;
2. School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing 100049;
3. Landinn Center, Big Data Academy, Zhongke, Zhengzhou 450046;
4. School of Software Engineering, Beijing Jiaotong University, Beijing 100044

全文: PDF (1033 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 时序知识图谱海量稀疏,实体的长尾分布导致对分布外实体的推理泛化性较差,历史交互低频导致对未来事件的预测偏差较大.为此,文中提出故事启发大语言模型的时序知识图谱预测方法,利用大语言模型的世界知识储备和复杂语义推理能力,增强对分布外实体的理解和交互稀疏事件的关联.首先,根据时序知识图谱中时间和结构的特性筛选“关键事件树”,通过历史事件筛选策略提炼最具代表性的事件,并摘要当前查询相关的历史信息,减少数据输入量并保留最重要的信息.然后,微调大语言模型生成器,生成时序语义关联且符合逻辑的“关键事件树”叙事故事,作为非结构化输入.在生成过程中,特别关注事件之间的因果关系和时间顺序,确保生成的故事具有连贯性和合理性.最后,利用大语言模型推理器推理缺失的时序实体.在3个公开数据集上的实验表明,文中方法可充分发挥大模型的能力,完成精准的时序实体推理.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈娟
赵新潮
隋京言
祁麟
田辰
庞亮
方金云
关键词 时序知识图谱(TKG)大语言模型关键事件树时序故事事件推理    
Abstract:The temporal knowledge graph(TKG) is characterized by vast sparsity, and the long-tail distribution of entities leads to poor generalization in reasoning for out-of-distribution entities. Additionally, the low infrequency of historical interactions results in biased predictions for future events. Therefore, a narrative-driven large language model for TKG Prediction is proposed. The world knowledge and complex semantic reasoning capabilities of large language models are leveraged to enhance the understanding of out-of-distribution entities and the association of sparse interaction events. Firstly, a key event tree is selected based on the temporal and structural characteristics of TKG, and the most representative events are extracted through a historical event filtering strategy. Relevant historical information is summarized to reduce input data while the most important information is retained. Then, the large language model generator is fine-tuned to produce logically coherent "key event tree" narratives as unstructured input. During the generation process, special attention is paid to the causal relationships and temporal sequences of events to ensure the coherence and rationality of the generated stories. Finally, the large language model is utilized as a reasoner to infer the missing temporal entities. Experiments on three public datasets demonstrate that the proposed method effectively leverages the capabilities of large models to achieve more accurate temporal entity reasoning.
Key wordsTemporal Knowledge Graph(TKG)    Large Language Model    Key Event Tree    Temporal Story    Event Inference   
收稿日期: 2024-07-22     
ZTFLH: TP391  
通讯作者: 庞 亮,博士,助理研究员,主要研究方向为自然语言处理、机器学习.E-mail:pangliang@ict.ac.cn.   
作者简介: 陈 娟,博士研究生,主要研究方向为时序知识图谱、大语言模型、自然语言处理.E-mail:chenjuan@ict.ac.cn. 赵新潮,硕士研究生,主要研究方向为自然语言处理.E-mail:zxcxinchao@foxmail.com. 隋京言,博士研究生,主要研究方向为算法设计、机器学习、深度学习、组合优化.E-mail:suijingyan@ict.ac.cn. 祁 麟,硕士研究生,主要研究方向为图神经网络、自然语言处理.E-mail:qilin2301@gmail.com. 田 辰,硕士研究生,主要研究方向为图神经网络、自然语言处理.E-mail: tianchen@bjtu.edu.cn. 方金云,博士,研究员,主要研究方向为海量空间信息技术研究.E-mail:fangjy@ict.ac.cn.
引用本文:   
陈娟, 赵新潮, 隋京言, 祁麟, 田辰, 庞亮, 方金云. 故事启发大语言模型的时序知识图谱预测[J]. 模式识别与人工智能, 2024, 37(8): 715-728. CHEN Juan, ZHAO Xinchao, SUI Jingyan, QI Lin, TIAN Chen, PANG Liang, FANG Jinyun. Narrative-Driven Large Language Model for Temporal Knowledge Graph Prediction. Pattern Recognition and Artificial Intelligence, 2024, 37(8): 715-728.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202408005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I8/715
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn