模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (1): 105-110    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于音素识别的语种辨识方法中的因子分析
仲海兵,宋彦,戴礼荣
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室合肥230027
Factor Analysis for Language Identification Based on Phoneme Recognition
ZHONG Hai-Bing, SONG Yan, DAI Li-Rong
iFlyTek Speech Laboratory,Department of Electronic Engineering and Information Science,University of Science and Technology of China,Hefei 230027

全文: PDF (403 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在基于音素识别的语种辨识系统中,特定的一段语音,音素识别的结果会受到说话人和信道等干扰因素的影响。对此,文中基于音素搭配关系对每段语音构建相应的特征向量表示。在向量空间中,利用因子分析建立噪声子空间的数学描述模型,并在语言模型的训练和识别过程加以消除。在NISTLRE2007的测试任务中,相对于基于音素识别的语种辨识基线系统,该方法可有效提高系统性能。在30s时长测试中,基于音素识别的语言模型和基于音素识别的支持向量机模型的等错误率分别相对降低14。4%和12。9%。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
仲海兵
宋彦
戴礼荣
关键词 自动语种识别因子分析音素识别器    
Abstract:In the phoneme recognition based language identification system, the key issue is whether the tokens or the token sequence can reflect the language related information or not. However, it is observed that for certain utterance, the noise in the output token sequence from the phone recognizer is introduced due to the channel, speaker and background clutters. To address this problem, each utterance is represented in n-gram vector. And in this vector space, the factor analysis is applied to model the noise subspace, which will be reduced in final modeling process. The experiment results on NIST LRE 2007 show that the proposed method can outperform the existing phone recognition based language identification system. In 30s evaluation task, the equal error rate (EER) of recognition reduces relatively about 14.4% against the baseline phone recognition followed by language modeling (PRLM) system, while about 12.9% against the baseline phone recognition followed by support vector machine (PRSVM) system.
Key wordsAutomatic Language Identification    Factor Analysis    Phone Recognizer   
收稿日期: 2010-07-26     
ZTFLH: TN912.34  
作者简介: 仲海兵,男,1986年生,硕士研究生,主要研究方向为语种识别、语音信号处理。E-mail:zhbing@mail。ustc。edu。cn。宋彦,男,1972年生,博士,讲师,主要研究方向为音、视频内容分析与检索。戴礼荣,男,1962年生,教授,博士生导师,主要研究方向为数字信号处理、模式识别。
引用本文:   
仲海兵,宋彦,戴礼荣. 基于音素识别的语种辨识方法中的因子分析[J]. 模式识别与人工智能, 2012, 25(1): 105-110. ZHONG Hai-Bing, SONG Yan, DAI Li-Rong. Factor Analysis for Language Identification Based on Phoneme Recognition. , 2012, 25(1): 105-110.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I1/105
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn