模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2016, Vol. 29 Issue (7): 616-624    DOI: 10.16451/j.cnki.issn1003-6059.201607005
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于向量自回归模型的微博隐式话题流行度预测*
段东圣1,李鹏霄1,李玉华2,李瑞轩2
1.国家计算机网络应急技术处理协调中心 北京 100029
2.华中科技大学 计算机科学与技术学院 武汉 430074
Vector Autoregression Model Based Microblog Hidden Topic Popularity Prediction
DUAN Dongsheng1, LI Pengxiao1, LI Yuhua2, LI Ruixuan2
1.National Computer Network Emergency Response Technical Team/Coordination Center of China, Beijing 100029
2.School of Computer Science and Technology, Huazhong University of Science and Technology,Wuhan 430074

全文: PDF (891 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 现有话题流行度预测方法仅基于话题本身的特征进行流行度预测,未考虑不同话题间的相关性.然而在微博上下文不同的话题之间存在一定的相关性,特别是在同一个事件的不同话题之间.因此,文中利用动态话题模型探测微博中的隐式话题及其流行度时间序列,通过JensenShannon散度和皮尔逊相关系数分别分析话题间的内容和时序相关度,然后在预测模型中引入话题时序相关性,提出基于向量自回归模型的微博隐式话题流行度预测算法.通过在真实微博数据上的实验分析可知,相比未考虑话题相关性的算法,文中算法具有更高的预测准确率和更好的模型拟合效果.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract:The existing topic popularity prediction methods predict the topic popularity just based on the features of topic and the correlations between different topics are not taken into account. However, there are correlations among different topics in microblog contexts, especially for the topics of the same event. Aiming at this problem, dynamic topic model is firstly employed to detect the hidden topics and their popularity time series from microblogs in this paper. Then, the Jensen-Shannon divergence and Pearson′s correlation coefficient are computed to investigate the correlations among topic contents and among topic time-series, respectively. Thus, the motivation of introducing topics correlation is revealed. Finally, a vector auto-regressive (VAR) model based Microblog hidden topic popularity prediction algorithm is proposed by introducing correlations among different topic time-series in model training. Experiments are conducted on the real data. Experimental results show that the proposed algorithm performs better in prediction accuracy and model fitting than algorithms without consideration of correlations among different topics.
收稿日期: 2015-05-19     
ZTFLH: TP 391.4  
基金资助:国家自然科学基金项目(No.61402123,61300222,61173170)、国家计算机网络应急技术处理协调中心青年基金项目(No.2015QN-006,2014QN01)、北京科技计划项目(No.Z161100000216128)、软件工程国家重点实验室开放基金项目(No.SKLSE2012-09-11)资助
作者简介: 段东圣,男,1987年生,博士,工程师,主要研究方向为社交网络分析和挖掘.Email:dds@cert.org.cn.李鹏霄(通讯作者),男,1986年生,博士,工程师,主要研究方向为通信技术.Email:lpx@cert.org.cn.李玉华,女,1968年生,博士,副教授,主要研究方向为社会网络挖掘、图挖掘、语义web等.Email:idcliyuhua@hust.edu.cn.李瑞轩,男,1974年生,博士,教授,主要研究方向为云计算、信息检索、社会网络、系统安全等.Email:rxli@hust.edu.cn.
引用本文:   
段东圣,李鹏霄,李玉华,李瑞轩. 基于向量自回归模型的微博隐式话题流行度预测*[J]. 模式识别与人工智能, 2016, 29(7): 616-624. DUAN Dongsheng, LI Pengxiao, LI Yuhua, LI Ruixuan. Vector Autoregression Model Based Microblog Hidden Topic Popularity Prediction. , 2016, 29(7): 616-624.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201607005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2016/V29/I7/616
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn