模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2015, Vol. 28 Issue (8): 673-679    DOI: 10.16451/j.cnki.issn1003-6059.201508001
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法*
宋阳,凌震华,戴礼荣
中国科学技术大学 语音及语言信息处理国家工程实验室 合肥 230027
Restricted Boltzmann Machine Based Spectrum Modeling and Unit Selection Speech Synthesis Method
SONG Yang, LING Zhen-Hua, DAI Li-Rong
National Engineering Laboratory for Speech and Language Information Processing, University of Science and Technology of China, Hefei 230027

全文: PDF (467 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法.在模型训练阶段,采用受限玻尔兹曼机对包含丰富细节的频谱特征建模,如谱包络、短时幅度谱,取代传统的使用对角方差单高斯模型和梅尔倒谱特征的频谱建模方法,改善声学模型对于频谱特征的描述能力.在语音合成阶段,使用训练得到的受限玻尔兹曼机模型计算备选样本频谱特征的对数似然值,并通过分段线性映射构建单元挑选的目标代价函数.实验表明文中方法可有效提高合成语音的自然度.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
宋阳
凌震华
戴礼荣
关键词 语音合成 单元挑选 隐马尔可夫模型 受限玻尔兹曼机    
Abstract:A restricted Boltzmann machine based spectrum modeling and unit selection speech synthesis method is proposed. At the model training stage, the restricted Boltzmann machine is used to model spectral features with rich details, such as spectral envelopes and short-time spectral amplitudes, instead of using the single Gaussian model with diagonal variance and mel-cepstrum feature for spectral model in the traditional approach. Thus, the description capability of the acoustical model for spectral feature is improved. At the speech synthesis stage, the restricted Boltzmann machine model is adopted to calculate the log likelihoods of spectral feature of candidate sample, and a method of piecewise linear mapping is proposed to construct target cost function for unit selection. The experimental results indicate that the proposed method can effectively improve the naturalness of synthetic speech.
Key wordsSpeech Synthesis    Unit Selection    Hidden Markov Model    Restricted Boltzmann Machine   
收稿日期: 2014-04-25     
ZTFLH: TN 912.33  
基金资助:国家自然科学基金项目(No.61273032)资助
作者简介: 宋阳,男,1989年生,硕士研究生,主要研究方向为语音合成.E-mail:ysong@mail.ustc.edu.cn.凌震华(通讯作者),男,1979年生,博士,副教授,主要研究方向为语音合成、说话人转换.E-mail:zhling@ustc.edu.cn.戴礼荣,男,1962年生,博士,教授,主要研究方向为语音信息处理、人机语音通信.
引用本文:   
宋阳,凌震华,戴礼荣. 基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法*[J]. 模式识别与人工智能, 2015, 28(8): 673-679. SONG Yang, LING Zhen-Hua, DAI Li-Rong. Restricted Boltzmann Machine Based Spectrum Modeling and Unit Selection Speech Synthesis Method. , 2015, 28(8): 673-679.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201508001      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2015/V28/I8/673
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn