模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2006, Vol. 19 Issue (1): 47-51    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种改进的多模式串匹配算法*
代六玲1,2,黄河燕2,陈肇雄2
1.北京理工大学 软件学院 北京 100081
2.中国科学院计算机语言信息工程研究中心 北京 100083
An Improved MultiPattern String Matching Algorithm
DAI LiuLing1,2, HUANG HeYan 2, CHEN ZhaoXiong2
1.Software Institute, Beijing Institute of Technology, Beijing 100081
2.Language Information Engineering Center, Chinese Academy of Sciences, Beijing 100083

全文: PDF (439 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在对著名的SunWu多模式串匹配算法进行分析之后,结合QS算法的优点,设计了一种较高效的多模式串匹配算法QMS.该算法使用散列技术和前缀表减少发生部分匹配时实际进行的模式串比较次数.在计算跳跃距离时,充分考虑当前窗口紧邻的下一个字符带来的信息,使用更加精确的跳跃距离计算方法以获得更大的平均跳跃距离,从而获得更高的扫描效率和空间利用率.在真实文本上的对比实验表明,在通常应用环境中,该算法缩短了扫描时间,取得了较好的效果.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
代六玲
黄河燕
陈肇雄
关键词 多模式串匹配BoyerMoore算法QuickSearch算法SunWu算法    
Abstract:A new algorithm for matching multiple strings at the same time is suggested. The new algorithm is based on the ideas of QS and SunWu algorithm, named as QMS (Quick Multipattern Searching) algorithm in this paper. QMS uses hashing and PREFIX table to decrease the number of comparisons. During the computation of the shift distance, the character closely after the current window is considered. Because the shift distance is computed with more accurate technique, larger average shift distance is acquired. More characters can be skipped when the text is scanned, so the algorithm becomes very efficient. Tests on an actual corpus show that QMS algorithm is much more efficient than SunWu algorithm under common circumstances.
Key wordsMultiPattern String Matching    BoyerMoore Algorithm    Quick Search Algorithm    SunWu Algorithm   
收稿日期: 2004-04-23     
ZTFLH: TP18  
基金资助:国家自然科学基金资助项目(No.60272088)
作者简介: 代六玲,男,1977年生,博士,主要研究方向为中文信息处理、网络内容管理.E-mail: dailiu@bit.edu.cn.黄河燕,女,1963年生,研究员,博士生导师,主要研究方向为自然语言处理与机器翻译、大型智能应用系统.陈肇雄,男,1961年生,研究员,博士生导师,主要研究方向为自然语言处理、大型智能应用系统.
引用本文:   
代六玲,黄河燕,陈肇雄. 一种改进的多模式串匹配算法*[J]. 模式识别与人工智能, 2006, 19(1): 47-51. DAI LiuLing, HUANG HeYan , CHEN ZhaoXiong. An Improved MultiPattern String Matching Algorithm. , 2006, 19(1): 47-51.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2006/V19/I1/47
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn