模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2013, Vol. 26 Issue (11): 1019-1025    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于PAD情感模型的可训练语音合成研究
陈雁翔1,2,龙润田1,3
1.合肥工业大学计算机与信息学院合肥230009
2.合肥工业大学计算机科学与技术博士后科研流动站合肥230009
3.上海师范大学语言研究所上海200234
Trainable Emotional Speech Synthesis Based on PAD
CHEN Yan-Xiang1,2,LONG Run-Tian1,3
1.School of Computer Information,Hefei University of Technology,Hefei 230009
2.Computer Science and Technology Postdoctoral Research Station,Hefei University of Technology,Hefei 230009
3.Institute of Linguistics,Shanghai Nonmal University,Shanghai,200234

全文: PDF (468 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 情感语音合成是情感计算和语音信号处理研究的热点之一,进行准确的语音情感分析是合成高质量情感语音的前提.文中采用PAD情感模型作为情感分析量化模型,对情感语料库中的语音进行情感分析和聚类,获得各情感PAD参数模型.由HMM语音合成系统合成的情感语音,通过PAD模型进行参数修正,使得合成语音的情感参数更加准确,从而提高情感语音合成的质量.实验表明该方法能较好地提高合成语音的自然度和情感清晰度,在同性别不同说话人中也能达到较好的性能.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈雁翔
龙润田
关键词 PAD情感模型可训练语音合成情感量化参数修正情感特征    
Abstract:Emotional speech synthesis is the emphasis and hotspot in affective computing and speech signal processing. In speech synthesis,accurate speech emotion analysis is a prerequisite for high-quality synthesis of emotional speech. In this paper,PAD emotional model is used to build a 3D emotional space for sentiment analysis and clustering of emotional corpus of speech in order to get emotional PAD parameters model. The emotional speech is synthesized by HMM speech synthesis system,and the parameters of synthesized speech emotion are modified by PAD model. Therefore,the quality of emotional speech synthesis is improved. The experimental results show that the proposed method improves the naturalness of synthesized speech and the clarity of emotion and also achieves good performance among different male speakers.
Key wordsPAD Emotional model    Trainable Speech Synthesis    Emotional Quantification    Parameter Calibration    Emotional Characteristic   
收稿日期: 2012-10-16     
ZTFLH: TN912.33  
基金资助:国家自然科学基金项目(No.61105076 )、第51批中国博士后科学基金项目(No.2012M511402)、安徽省自然科学基金项目(No.11040606M127)、安徽省语音产业科技创新专项项目(No.11010202192)资助
作者简介: 陈雁翔(通讯作者),女,1972年生,博士,副教授,主要研究方向为情感计算、语音信号处理.E-mail:Chenyx@hfut.edu.cn.龙润田,男,1991年生,硕士研究生,主要研究方向为语音信号处理.
引用本文:   
陈雁翔,龙润田. 基于PAD情感模型的可训练语音合成研究[J]. 模式识别与人工智能, 2013, 26(11): 1019-1025. CHEN Yan-Xiang,LONG Run-Tian. Trainable Emotional Speech Synthesis Based on PAD. , 2013, 26(11): 1019-1025.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2013/V26/I11/1019
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn