模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2009, Vol. 22 Issue (2): 270-274    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种基于说话者话路变化的主成分分析方法
龙艳花,郭武,戴礼荣
中国科学技术大学 电子工程与信息科学系 科大讯飞语音实验室 合肥 230027
A PCA Method Based on Speaker Session Variability
LONG Yan-Hua, GUO Wu, DAI Li-Rong
iFly Speech Laboratory, Department of Electronic Engineering and Information Science, University of Science and Technology of China, Heifei 230027

全文: PDF (395 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在文本无关的说话人确认中,训练与测试语音中信道环境的不匹配是一种说话者话路变化问题.这种不匹配会严重降低说话人确认系统的性能.为了有效解决该问题,本文提出一种基于说话者话路变化的主成分分析方法,将其应用在说话者确认中,我们将这种方法称为面向话路变化的主成分分析方法.这种方法能够与类内协方差归一化结合,进一步提高识别效果.在NIST 2006年说话者识别数据库上进行实验,证明该方法不仅在系统识别等错误率上比基线系统有了24.2%的降低,而且在计算复杂度上相对于目前传统的方法也有很大的优势.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
龙艳花
郭武
戴礼荣
关键词 面向话路变化的主成分分析(SVPCA)类内协方差归一化(WCCN)广义线性序列超向量说话者确认    
Abstract:In the text-independent speaker verification systems, the mismatch and variability of the channel and environment between training and testing is a session variability problem. It can greatly degrade the speaker recognition performance. To deal with the problem more efficiently, a modified PCA method is proposed called session variation principal component analysis (SVPCA) which can integrate with within class covariance normalization (WCCN). In the NIST 2006 verification task, the proposed method is compared with our previous baseline general linear discriminative sequence-support vector machine (GLDS-SVM) system. The experimental results show a relative reduction of up to 24.2% in error equal ratio (EER). Moreover, the proposed method has advantages in computational and memory costs, compared with the state-of-art systems.
Key wordsSession Variation Principal Component Analysis (SVPCA)    Within Class Covariance Normalization (WCCN)    General Linear Discriminative Sequence Supervector    Speaker Verification   
收稿日期: 2007-10-08     
ZTFLH: TN912.34  
作者简介: 龙艳花,女,1983年生,博士研究生,主要研究方向为说话人识别.E-mail: lyhsa@mail.ustc.edu.cn.郭武,男,1973年生,讲师,主要研究方向为说话人识别、语种识别.戴礼荣,男,1962年生,教授,博士生导师,主要研究方向为语音信号处理、语音识别、合成、说话人和语种识别、多媒体通信.
引用本文:   
龙艳花,郭武,戴礼荣. 一种基于说话者话路变化的主成分分析方法[J]. 模式识别与人工智能, 2009, 22(2): 270-274. LONG Yan-Hua, GUO Wu, DAI Li-Rong. A PCA Method Based on Speaker Session Variability. , 2009, 22(2): 270-274.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2009/V22/I2/270
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn