模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2013, Vol. 26 Issue (3): 254-259    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于话者无关模型的说话人转换方法
陈凌辉,凌震华,戴礼荣
中国科学技术大学语音及语言信息处理国家工程实验室合肥230027
Voice Conversion Based on Speaker Independent Model
CHEN Ling-Hui,LING Zhen-Hua,DAI Li-Rong
National Engineering Laboratory of Speech and Language Information Processing,
University of Science and Technology of China,Hefei 230027

全文: PDF (386 KB)   HTML (0 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出一种基于话者无关模型的说话人转换方法.考虑到音素信息共同存在于所有说话人的语音中,假设存在一个可以用高斯混合模型来描述的话者无关空间,且可用分段线性变换来描述该空间到各说话人相关空间之间的映射关系.在一个多说话人的数据库上,用话者自适应训练算法来训练模型,并在转换阶段使用源目标说话人空间到话者无关空间的变换关系来构造源与目标之间的特征变换关系,快速、灵活的构造说话人转换系统.通过主观测听实验来验证该算法相对于传统的基于话者相关模型方法的优点.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈凌辉
凌震华
戴礼荣
关键词 说话人转换话者无关模型高斯混合模型话者自适应训练    
Abstract:A voice conversion method based on speaker independent (SI) model is proposed. Considering the phoneme information that commonly exists in every speakers speech,an SI space described only by the phoneme information is assumed to exist. Gaussian mixture model (GMM) is adopted to model the distribution of the SI space,and the mapping relations from speaker dependent (SD) space to SI space are described by linear transformations. The SI model is trained by using speaker adaptive training (SAT) algorithm on a multi-speaker database. In the conversion phase,the conversion functionfromsource space to target space is quickly and flexibly built by joining the transformations from source space to SI space and SI space to target space. The advantage of the proposed method is proved by the results of some listening tests compared with two representative conventional methods.
Key wordsVoice Conversion    Speaker Independent Model    Gaussian Mixture Model    Speaker Adaptive Training   
收稿日期: 2012-05-03     
ZTFLH: TN912.33  
基金资助:国家自然科学基金资助项目(No.60905010)
作者简介: 陈凌辉(通讯作者),男,1986年生,博士研究生,主要研究方向为语音信号处理.E-mail:chenlh@mail.ustc.edu.cn.凌震华,男,1979年生,博士,副教授,主要研究方向为语音信号处理、语音合成.戴礼荣,男,1962年生,博士,教授,主要研究方向为语音识别、信号处理.
引用本文:   
陈凌辉,凌震华,戴礼荣. 基于话者无关模型的说话人转换方法[J]. 模式识别与人工智能, 2013, 26(3): 254-259. CHEN Ling-Hui,LING Zhen-Hua,DAI Li-Rong. Voice Conversion Based on Speaker Independent Model. , 2013, 26(3): 254-259.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2013/V26/I3/254
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn