模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2009, Vol. 22 Issue (1): 108-112    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于统计语言模型的蒙古文词切分*
侯宏旭1,2,3,刘群1,那顺乌日图2,牧仁高娃2,李锦涛1
1.中国科学院计算技术研究所 智能信息处理重点实验室 北京 100190
2.内蒙古大学 计算机学院 呼和浩特 010021
3.中国科学院研究生院 北京 100190
Mongolian Word Segmentation Based on Statistical Language Model
HOU Hong-Xu1,2,3, LIU Qun1, Nasanurtu2, Murengaowa2, LI Jin-Tao1
1.Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190
2.School of Computer Science, Inner Mongolia University, Huhhot 010021
3.Graduate University of Chinese Academy of Sciences, Beijing 100190

全文: PDF (320 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 通过对蒙古文词切分技术的分析,利用规则作为切分的基础,提出一种统计和规则相结合的蒙古文词切分方法.这种方法利用蒙古语统计语言模型作为排歧依据,使用的语言模型有基于词性的语言模型和Skip-N语言模型.其词切分准确率比基于规则的系统有较大提高.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
侯宏旭
刘群
那顺乌日图
牧仁高娃
李锦涛
关键词 蒙古语词切分语言模型词干词缀    
Abstract:Based on the analysis of Mongolian segmentation technique and the rules used as the foundation of word segmentation, a hybrid word segmentation method is proposed. It uses Mongolian statistical language model to eliminate the ambiguity in Mongolian word segmentation. A POS language model and a Skip-N language model are used, and an experiment system is thus created. The experimental results are better than those of the system based on rules.
Key wordsMongolian    Word Segmentation    Language Model    Etyma and Suffix   
收稿日期: 2008-03-03     
ZTFLH: TP391  
基金资助:内蒙古自然科学基金项目(No.200607010805)、国家973计划前期研究项目(No.2007CB316503)资助
作者简介: 侯宏旭,男,1972年生,副教授,主要研究方向为中文信息处理.E-mail: cshhx@imu.edu.cn.刘群,男,1966年生,研究员,主要研究方向为自然语言处理.那顺乌日图,男,1959年生,教授,主要研究方向为计算语言学.牧仁高娃,女,1982年生,硕士研究生,主要研究方向为计算语言学.李锦涛,男,1962年生,研究员,主要研究方向为数字媒体处理技术.
引用本文:   
侯宏旭,刘群,那顺乌日图,牧仁高娃,李锦涛. 基于统计语言模型的蒙古文词切分*[J]. 模式识别与人工智能, 2009, 22(1): 108-112. HOU Hong-Xu, LIU Qun, Nasanurtu, Murengaowa, LI Jin-Tao. Mongolian Word Segmentation Based on Statistical Language Model. , 2009, 22(1): 108-112.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2009/V22/I1/108
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn