模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2009, Vol. 22 Issue (3): 417-421    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于自适应高斯混合模型特征映射的说话人确认
杨世清,戴蓓蒨,许敏强,刘青松
中国科学技术大学 电子科学与技术系 合肥 230027
Speaker Verification Based on Adapted Gaussian Mixture Model Feature Mapping
YANG Shi-Qing, DAI Bei-Qian, XU Min-Qiang, LIU Qing-Song
Department of Electronic Science and Technology, University of Science and Technology of China, Hefei 230027

全文: PDF (352 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 为了解决电话语音说话人确认系统中信道非线性失真导致系统性能下降的问题,提出一种消除信道影响的特征映射方法.采用高斯混合模型建立语音模型,通过最大后验概率自适应某种信道的语音模型,两种模型间相应高斯类的差异描述了该信道对于不同语音的影响.由此得出信道映射规则进行参数补偿,消除训练和测试语音中不匹配的影响.在NIST 1999年和2004年男性说话人的数据库上进行的实验表明,此方法使系统的等错误率分别改善了14.7%和15.18%.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
杨世清
戴蓓蒨
许敏强
刘青松
关键词 说话人确认信道失配特征映射(FM)最大后验概率(MAP)信道映射规则    
Abstract:To mitigate the channel effect of the handset speaker recognition system, a feature mapping (FM) method is proposed to eliminate the channel variability. Gaussian mixture model (GMM) is used to establish a channel-independent voice model, and the channel-dependent voice models are derived from the GMM using a well-known maximum a posteriori (MAP) adaptation algorithm. The difference of clustering gaussians describes the channel variability for different voice. The mismatch between train and test is compensated by mapping channel rules. Experimental results on NIST99 and 2004 SRE database show that the system performance can be increased by 14.7% and 15.18% by the proposed approach.
Key wordsSpeaker Verification    Channel Mismatch    Feature Mapping (FM)    Maximum A Posteriori (MAP)    Channel Mapping Rules   
收稿日期: 2008-03-07     
ZTFLH: TP391  
作者简介: 杨世清,男,1982年生,硕士研究生,主要研究方向为说话人识别.戴蓓蒨,女,1942年生,教授,博士生导师,主要研究方向为语音信号、信息处理、说话人识别.E-mail: bqdai@ustc.edu.cn.许敏强,男,1982年生,博士研究生,主要研究方向为语音信号、信息处理.刘青松,男,1984年生,博士研究生,主要研究方向为语音识别、说话人识别.
引用本文:   
杨世清,戴蓓蒨,许敏强,刘青松. 基于自适应高斯混合模型特征映射的说话人确认[J]. 模式识别与人工智能, 2009, 22(3): 417-421. YANG Shi-Qing, DAI Bei-Qian, XU Min-Qiang, LIU Qing-Song. Speaker Verification Based on Adapted Gaussian Mixture Model Feature Mapping. , 2009, 22(3): 417-421.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2009/V22/I3/417
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn