模式识别与人工智能
2025年4月16日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2021, Vol. 34 Issue (2): 176-188    DOI: 10.16451/j.cnki.issn1003-6059.202102009
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
融合Copulas理论和关联规则挖掘的查询扩展
黄名选1,2, 胡小春2
1.广西财经学院 广西跨境电商智能信息处理重点实验室 南宁 530003
2.广西财经学院 信息与统计学院 南宁 530003
Query Expansion Combining Copulas Theory and Association Rules Mining
HUANG Mingxuan1,2, Hu Xiaochun2
1. Guangxi Key Laboratory of Cross-Border E-commerce Intelligent Information Processing, Guangxi University of Finance and Economics, Nanning 530003
2. School of Information and Statistics, Guangxi University of Finance and Economics, Nanning 530003

全文: PDF (779 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 将Copulas理论引入文本特征词关联模式挖掘,提出融合Copulas理论和关联规则挖掘的查询扩展算法.从初检文档集中提取前列n篇文档构建伪相关反馈文档集或用户相关反馈文档集,利用基于Copulas理论的支持度和置信度对相关反馈文档集挖掘含有原查询词项的特征词频繁项集和关联规则模式,从这些规则模式中提取扩展词,实现查询扩展.在NTCIR-5 CLIR中英文本语料上的实验表明,文中算法可有效遏制查询主题漂移和词不匹配问题,改善信息检索性能,提升扩展词质量,减少无效扩展词.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
黄名选
胡小春
关键词 自然语言处理查询扩展信息检索关联规则文本挖掘    
Abstract:The Copulas theory is introduced into the association pattern mining of text feature terms, and a query expansion algorithm combining Copulas theory and association rules mining is proposed. Firstly, top n documents of the document set returned by the query are extracted to construct the pseudo-relevance feedback document set (PRFDS) or user relevance feedback document set(URFDS). Then, the support and the confidence based on Copulas theory are applied to mine the feature term frequent itemsets and association rule patterns with the original query terms in PRFDS or URFDS, and the expansion terms are obtained from the patterns to realize query expansion. The experimental results on NTCIR-5 CLIR Chinese and English corpus show that the proposed expansion algorithm effectively restrains the problems of query topic drift and word mismatch, and enhances the performance of information retrieval with the quality of expansion terms improved and the invalid expansion terms reduced.
Key wordsNatural Language Processing    Query Expansion    Information Retrieval    Association Rule    Text Mining   
收稿日期: 2020-07-06     
ZTFLH: TP 311  
基金资助:国家自然科学基金项目(No.61762006)资助
通讯作者: 黄名选,硕士,教授,主要研究方向为数据挖掘、信息检索、机器学习.E-mail:mingxh05@163.com.   
作者简介: 胡小春,硕士,副教授,主要研究方向为区块链、数据分析.E-mail:huxch999@163.com.
引用本文:   
黄名选, 胡小春. 融合Copulas理论和关联规则挖掘的查询扩展[J]. 模式识别与人工智能, 2021, 34(2): 176-188. HUANG Mingxuan, Hu Xiaochun. Query Expansion Combining Copulas Theory and Association Rules Mining. , 2021, 34(2): 176-188.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202102009      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2021/V34/I2/176
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn