模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2010, Vol. 23 Issue (6): 822-828    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于最小生成误差的HMM模型聚类自动优化
卢恒,凌震华,雷鸣,戴礼荣,王仁华
中国科学技术大学 电子工程与信息科学系 讯飞语音实验室 合肥 230027
Minimum Generation Error Based Optimization of HMM Model Clustering for Speech Synthesis
LU Heng,LING Zhen-Hua,LEI Ming,DAI Li-Rong,WANG Ren-Hua
iFlytek Speech Laboratory,Department of Electronic Engineering and Information Science,
University of Science and Technology of China,Hefei 230027

全文: PDF (478 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 为改善决策树聚类的效果,避免可能出现的聚类模型过训练或欠训练的情况,提出一种基于最小生成误差以及通过交叉验证优化最小描述距离(MDL)因子选取的方法。文中通过计算交叉验证中的生成误差选择MDL因子,从而优化决策树大小。实验结果表明,此方法相对传统的固定MDL门限设定方法,更有效提升合成语音的音质和自然度。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
卢恒
凌震华
雷鸣
戴礼荣
王仁华
关键词 隐马尔可夫模型(HMM)语音合成决策树聚类最小描述距离(MDL)交叉验证(CV)    
Abstract:To improve the decision tree clustering and avoid possible clustered model over-training and less-training, a minimal generation error criterion and cross-validation (CV) based minimal description length factor optimizing method is introduced. CV based generation error is calculated to optimize the scale of the decision tree. Results of both subjective and objective tests show that synthesized speech by the proposed method outperforms the synthesized speech by the baseline one system in both quality and naturalness.
Key wordsHidden Markov Model (HMM)    Speech Synthesis    Decision Tree Clustering    Minimal Description Length (MDL)    Cross-Validation (CV)   
收稿日期: 2009-06-03     
ZTFLH: TN912.33  
作者简介: 卢恒,男,1984年生,博士研究生,主要研究方向为语音合成.E-mail:luhenglh@mail.ustc.edu.cn.凌震华,男,1979年生,博士后,主要研究方向为语音合成.雷鸣,男,1985年生,博士研究生,主要研究方向为语音合成.戴礼荣,男,1962年生,教授,博士生导师,主要研究方向为语音合成、语音识别、语种识别、说话人识别、数字信号处理.王仁华,男,1942年生,教授,博士生导师,主要研究方向为语音合成、语音识别、语音评测、数字信号处理。
引用本文:   
卢恒,凌震华,雷鸣,戴礼荣,王仁华. 基于最小生成误差的HMM模型聚类自动优化[J]. 模式识别与人工智能, 2010, 23(6): 822-828. LU Heng,LING Zhen-Hua,LEI Ming,DAI Li-Rong,WANG Ren-Hua. Minimum Generation Error Based Optimization of HMM Model Clustering for Speech Synthesis. , 2010, 23(6): 822-828.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2010/V23/I6/822
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn