模式识别与人工智能
2025年4月7日 星期一   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2008, Vol. 21 Issue (6): 794-798    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
采用高斯概率分布和支持向量机的说话人确认*
郭武,戴礼荣,王仁华
中国科学技术大学 电子工程与信息科学系 科大讯飞语音实验室 合肥 230027
Speaker Verification Based on Gaussian Probability Distribution and SVM
GUO Wu, DAI Li-Rong, WANG Ren-Hua
iFly Speech Laboratory, Department of Electronic Engineering and Information Science,
University of Science and Technology of China, Heifei 230027

全文: PDF (348 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年NIST SRE 1conv4w-1conv4w数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
郭武
戴礼荣
王仁华
关键词 广义线性判别式序列(GLDS)梅尔刻度式倒谱参数(MFCC)线性预测倒谱参数(LPCC)    
Abstract:In the text-independent speaker verification research, the probability distribution against the universal background model (PD-UBM) is calculated. And the score of each UBM Gaussian mixture is adopted as the input feature of the support vector machine (SVM) during the training and testing process. The proposed PD-UBM algorithm with linear kernel function can obtain the same or better performance as the generalized linear discriminant sequence (GLDS) kernel system. Furthermore, if the scores of the Gaussian mixture models (GMM-UBM), the GLDS and the PD-UBM are combined, the significant improvement of the system can be achieved. In 2006, on NIST 1conv4w-1conv4w speaker recognition evaluation (SRE) corpus, the fusion system obtained 25% relative improvement equal error rate (ERR) of over the GMM-UBM system.
Key wordsGeneralized Linear Discriminant Sequence (GLDS)    Mel Frequency Cepstrum Coefficient (MFCC)    Linear Prediction Cepstrum Coefficient (LPCC)   
收稿日期: 2007-05-04     
ZTFLH: TN912.34  
基金资助:国家863计划资助项目(No.2006AA010104)
作者简介: 郭武,男,1973年生,讲师,主要研究方向为说话人识别.E-mail:guowu@mail.ustc.edu.cn.戴礼荣,男,1962年生,博士,教授,主要研究方向为语音识别、语音合成、基于内容的音视频检索等.王仁华,男,1943年生,教授,博士生导师,主要研究方向为语音通信、数字信号处理及其应用、多媒体通信.
引用本文:   
郭武,戴礼荣,王仁华. 采用高斯概率分布和支持向量机的说话人确认*[J]. 模式识别与人工智能, 2008, 21(6): 794-798. GUO Wu, DAI Li-Rong, WANG Ren-Hua. Speaker Verification Based on Gaussian Probability Distribution and SVM. , 2008, 21(6): 794-798.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2008/V21/I6/794
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn