模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (3): 521-526    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于判别式模型的蒙英词对齐方法
张贯虹1,乌达巴拉2,巩政3
1。合肥学院计算机科学与技术系网络与智能信息处理重点实验室合肥230601
2。中国科学院合肥智能机械研究所仿生感知与控制研究中心合肥230031
3。内蒙古大学计算机学院呼和浩特010021
A Mongolian-English Word Alignment Approach Based on Discriminative Model
ZHANG Guan-Hong1, Odbal2, GONG Zheng3
1.Key Laboratory of Network and Intelligent Information Processing,Department of Computer Science and Technology,Hefei University,Hefei 230601
2.Research Center for Biomimetic Sensing and Control,Institutes of Intelligent Machines,
Chinese Academy of Sciences,Hefei 230031
3.College of Computer Science,Inner Mongolia University,Hohhot 010021

全文: PDF (397 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 词对齐是自然语言处理领域的基础性研究课题之一。文中提出基于链式条件随机场(CRF)判别式模型的蒙古文-英文词对齐方法。该方法根据蒙古文和英文之间的差异,选择词形、词汇、词性等信息作为特征,建立双层CRF词对齐模型:在第1层利用CRF模型实现子块的对齐;在第2层利用CRF模型得到块内词之间的对齐结果。通过人工构建的词对齐语料开展相应实验。实验结果表明,该方法有效提高蒙英词对齐质量。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张贯虹
乌达巴拉
巩政
关键词 条件随机场(CRF)判别式模型词对齐语言特征    
Abstract:Word alignment is an essential issue in the field of natural language processing.A discriminative word alignment method is proposed using the linear CRF model for Mongolian-English language pair. According to the differences between Mongolian and English languages, morphological, lexical and part-of-speech features can be incorporated into the CRF model, and a dual-layer CRF word alignment model is constructed. In the first layer, the chunks that are split from the sentence are aligned. Then in the second layer, the words of chunks are aligned using CRF word alignment model. The experimental results on Mongolian-English task demonstrate that the proposed method improves the performance of word alignment.
Key wordsConditional Random Field (CRF) Discriminative Model    Word Alignment    Linguistic Feature   
收稿日期: 2010-09-07     
ZTFLH: TP391  
基金资助:安徽省高等学校省级自然科学研究项目(No.KJ2012B147)、安徽省高等学校优秀青年人才基金项目(No.2012SQRL171)资助
作者简介: 张贯虹,男,1980年生,讲师,主要研究方向为语音识别、自然语言处理。E-mail:xishazgh@163。com。乌达巴拉,女,1982年生,助理研究员,主要研究方向为自然语言处理、机器翻译、情感分析。巩政,男,1965年生,副教授,主要研究方向为自然语言处理。
引用本文:   
张贯虹,乌达巴拉,巩政. 基于判别式模型的蒙英词对齐方法[J]. 模式识别与人工智能, 2012, 25(3): 521-526. ZHANG Guan-Hong, Odbal, GONG Zheng. A Mongolian-English Word Alignment Approach Based on Discriminative Model. , 2012, 25(3): 521-526.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I3/521
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn