模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2011, Vol. 24 Issue (4): 457-463    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
改进的跨语种语音合成模型自适应方法
刘航,凌震华,郭武,戴礼荣
中国科学技术大学电子工程与信息科学系讯飞语音实验室合肥230027
An Improved Cross-Language Model Adaptation Method for Speech Synthesis
LIU Hang, LING Zhen-Hua, GUO Wu, DAI Li-Rong
iFLYTEK Speech Laboratory,Department of Electronic Engineering and Information Science,University of Science and Technology of China,Hefei 230027

全文: PDF (524 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 统计参数语音合成中的跨语种模型自适应主要应用于目标说话人语种与源模型语种不同时,使用目标发音人少量语音数据快速构建具有其音色特征的源模型语种合成系统。本文对传统的基于音素映射和三音素模型的跨语种自适应方法进行改进,一方面通过结合数据挑选的音素映射方法以提高音素映射的可靠性,另一方面引入跨语种的韵律信息映射以弥补原有方法中三音素模型在韵律表征上的不足。在中英文跨语种模型自适应系统上的实验结果表明,改进后系统合成语音的自然度与相似度相对传统方法都有了明显提升。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘航
凌震华
郭武
戴礼荣
关键词 隐马尔科夫模型(HMM)语音合成跨语种模型自适应音素映射    
Abstract:Cross-language model adaptation in statistical parametric speech synthesis is used for rapidly constructing a text-to-speech (TTS) system with the target speakers characteristics when the source and the target speakers languages are different. In this paper, the conventional cross-language adaptation method based on phone-mapping and triphone models is improved by two means. Firstly, phone mapping combined with data-selection is adopted to improve its reliability. Secondly, cross-language prosodic information mapping is introduced to make use of prosodic information, which is ignored in the triphone model. Experiments on Chinese-to-English adaptation show that the synthesized speech using the improved method has much better naturalness and speaker similarity compared with the result of conventional method.
Key wordsHidden Markov Model (HMM)    Speech Synthesis    Cross-Language Model Adaptation    Phone Mapping   
收稿日期: 2010-06-02     
ZTFLH: TN912.34  
基金资助:中央高校基本科研业务费专项资金资助项目
作者简介: 刘航,男,1983年生,硕士研究生,主要研究方向为语音合成,说话人自适应。E-mail:lhang@mail。ustc。edu。cn。凌震华,男,1979年生,博士后,主要研究方向为语音合成。郭武,男,1973年生,博士,讲师,主要研究方向为说话人与语种识别。戴礼荣,男,1962年生,教授,博士生导师,主要研究方向为语音合成、语音识别、语种识别、说话人识别、数字信号处理。E-mail:lrdai@ustc。edu。cn。
引用本文:   
刘航,凌震华,郭武,戴礼荣. 改进的跨语种语音合成模型自适应方法[J]. 模式识别与人工智能, 2011, 24(4): 457-463. LIU Hang, LING Zhen-Hua, GUO Wu, DAI Li-Rong. An Improved Cross-Language Model Adaptation Method for Speech Synthesis. , 2011, 24(4): 457-463.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2011/V24/I4/457
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn