模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2007, Vol. 20 Issue (5): 630-635    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于部分整体匹配的文档结构相似度计算*
马军1,陈竹敏1,赵嫣1,雷景生1,2
1.山东大学 计算机科学与技术学院 济南 250061
2.海南大学 信息科学技术学院 海口 570228
Computation of Document Structural Similarity Based on PartWhole Matching
MA Jun1, CHEN ZhuMin1, ZHAO Yan1, LEI JingSheng1,2
1.Department of Computer Science and Technology, Shandong University, Jinan 250061
2.College of Information Science and Technology, Hainan University, Haikou 570228

全文: PDF (402 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 传统的计算数字文档之间的结构相似度(DSS)的方法是基于树的编辑距离或Fourier变换.本文提出利用查询问题的结构化描述树Q与文档元数据描述树T之间的部分整体匹配求解DSS.给出用字符串表示有向标记树的方法,并把上述树之间的相似度计算转化为对应Q和T的字符串表示之间的匹配计算,从而导出高效的DSS算法.实验表明,对给定的结构化查询,本文算法在查全率和查准率上优于树编辑距离算法.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
马军
陈竹敏
赵嫣
雷景生
关键词 问题解答系统文档结构相似度(DSS)信息检索    
Abstract:Traditional algorithms for document structural similarity (DSS) are based on either tree edit distances or Fourier transformation. New ways for the computation of DSS are presented based on partwhole matching between the tree Q corresponding to the structural question description and the tree T corresponding to structural description of a document. A way is provided to label above trees by strings then the DSS between two trees is calculated based on string matching operations. Experimental results show the proposed algorithms are better than those based on tree edit distance in terms of recall and precision.
Key wordsQuestionAnswer Systems    Document Structural Similarity (DSS)    Information Retrieval   
收稿日期: 2006-12-08     
ZTFLH: TP301  
基金资助:教育部骨干教师基金项目(No.CNG04132)、国家科技支撑计划项目(No.2006BAH02A29)资助
作者简介: 马军,男,1956年生,教授,博士生导师,主要研究方向为信息检索、高性能计算.Email:majun@sdu.edu.cn.陈竹敏,男,1977年生,博士研究生,主要研究方向为Web服务、信息检索.赵嫣,女,1982年生,硕士研究生,主要研究方向为信息检索.雷景生,男,1966年生,教授,博士生导师,主要研究方向为信息检索、网格计算.
引用本文:   
马军,陈竹敏,赵嫣,雷景生. 基于部分整体匹配的文档结构相似度计算*[J]. 模式识别与人工智能, 2007, 20(5): 630-635. MA Jun , CHEN ZhuMin , ZHAO Yan , LEI JingSheng. Computation of Document Structural Similarity Based on PartWhole Matching. , 2007, 20(5): 630-635.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2007/V20/I5/630
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn