模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2008, Vol. 21 Issue (4): 541-545    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于标点信息和统计语言模型的语音停顿预测*
钱揖丽1,2,荀恩东3
1.北京工业大学 计算机科学学院 北京 100022
2.山西大学 计算机与信息技术学院 太原 030006
3.北京语言大学 信息科学学院 北京 100083
Prediction of Speech Pauses Based on Punctuation Information and Statistical Language Model
QIAN Yi-Li1,2, XUN En-Dong3
1.College of Computer Science, Beijing University of Technology, Beijing 1000222.
College of Computer and Information Technology, Shanxi University, Taiyuan 0300063.
College of Information Sciences, Beijing Language and Culture University, Beijing 100083

全文: PDF (387 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 语音停顿被认为是有声语言的标点符号.在语言交流中,说话人会在韵律短语的边界处插入长短不同的停顿.利用这一性质,在调查标点符号停顿作用的基础上,提出基于标点信息预测语音停顿的思想,阐述基于标点和统计模型的训练语料自动获取以及语音停顿预测方法,讨论训练语料规模对模型性能的影响,并比较基于标点信息的自动获取语料与人工标注语料的性能.实验结果显示,汉语的标点提供有价值的停顿信息,基于汉语标点信息能够有效预测语音停顿.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
钱揖丽
荀恩东
关键词 标点符号语音停顿统计语言模型语料获取    
Abstract:Speech pauses are considered as punctuation marks of spoken language. People always insert different pauses at the boundaries of rhythmic phrases when communicating by language. Based on this characteristic, the speech pause of punctuation marks is investigated and the concept of predicting speech pauses using punctuation information is proposed. The punctuation-based and SLM-based methods are introduced to obtain training corpus and predict speech pauses. The influence of training corpus size on the performance of model is discussed. And the performance of punctuation-based corpus and manually-labeled corpus is compared. Experimental results show that the Chinese punctuation supplies valuable information on pause, and the method based on punctuation information can predict the Chinese speech pauses effectively.
Key wordsPunctuation Marks    Speech Pause    Statistic Language Model    Corpus Obtaining   
收稿日期: 2007-06-21     
ZTFLH: TP391  
基金资助:国家自然科学基金资助项目(No.60572159,60573184,60473139)
作者简介: 钱揖丽,女,1977年生,讲师,博士研究生,主要研究方向为自然语言处理.E-mail:qyl@sxu.edu.cn.荀恩东,男,1967年生,博士,硕士生导师,主要研究方向为自然语言处理.
引用本文:   
钱揖丽,荀恩东. 基于标点信息和统计语言模型的语音停顿预测*[J]. 模式识别与人工智能, 2008, 21(4): 541-545. QIAN Yi-Li, XUN En-Dong. Prediction of Speech Pauses Based on Punctuation Information and Statistical Language Model. , 2008, 21(4): 541-545.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2008/V21/I4/541
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn