模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (6): 937-942    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
用于说话人识别的基于可变因子整合的高斯混合模型
李杰,刘贺平
北京科技大学信息工程学院北京100083
Gaussian Mixture Model Based on Variable Factor-Integration for Speaker Recognition
LI Jie,LIU He-Ping
School of Information Engineering,University of Science and Technology Beijing,Beijing 100083

全文: PDF (347 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对传统高斯混合模型在噪声环境下识别率明显下降的问题,在借鉴随机概率分布模型间的α因子融合机制基础上,提出基于可变因子α整合的高斯混合模型。该模型通过引入可变因子使得混合模型中不同成分所占的比重又得到一次调整。实验结果表明,通过对该模型参数进行重估计,在TIMIT/NTIMIT两种不同语料库和不同样本集的情况下识别率较传统高斯模型均有提高。尤其在噪声环境和α因子取最优值时,识别率可提高8%,在NIST评测数据集上与GMM-UBM系统对比,识别率也有提高。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
李杰
刘贺平
关键词 可变因子高斯混合模型说话人识别    
Abstract:To solve the problem that the recognition rate of traditional Gaussian mixture model decreases significantly in noisy conditions, a Gaussian mixture model based on α variable factor-integration is presented by adopting the α-integration mechanism of multiple stochastic models in the form of probability distributions. Through introducing the variable factor, the proportion of different compositions in the mixture model is adjusted again. By re-estimating the proposed model parameters, the experimental results show the performance of the proposed model is better than that of the traditional Gaussian mixture model on databases TIMIT/NTIMIT and different speaker numbers. Especially in noisy conditions with the optimal value of α,the recognition rate is increased by 8%. On NIST evaluation database the experimental results show that the recognition rate is increased as well compared with GMM-UBM system.
Key wordsVariable Factor    Gaussian Mixture Model    Speaker Recognition   
收稿日期: 2011-11-07     
ZTFLH: TP912  
基金资助:国家自然科学基金项目(No.10671011)、北京市教委重点学科共建项目(No.XK100080537)资助
作者简介: 李杰,男,1985年生,博士研究生,主要研究方向为说话人识别、模式识别等。E-mail:lijierson8@163。com。刘贺平,男,1951年生,教授,博士生导师,主要研究方向为控制理论、混沌系统、模式识别。
引用本文:   
李杰,刘贺平. 用于说话人识别的基于可变因子整合的高斯混合模型[J]. 模式识别与人工智能, 2012, 25(6): 937-942. LI Jie,LIU He-Ping. Gaussian Mixture Model Based on Variable Factor-Integration for Speaker Recognition. , 2012, 25(6): 937-942.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I6/937
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn