模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2015, Vol. 28 Issue (12): 1093-1099    DOI: 10.16451/j.cnki.issn1003-6059.201512005
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于深度神经网络的语种识别*
崔瑞莲,宋彦,蒋兵,戴礼荣
中国科学技术大学 语音及语言信息处理国家工程实验室 合肥230027
Language Identification Based on Deep Neural Network
CUI Rui-Lian, SONG Yan, JIANG Bing, DAI Li-Rong
National Engineering Laboratory for Speech and Language Information Processing,
University of Science and Technology of China, Hefei 230027

全文: PDF (552 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 语音段的有效表示方法存在易混淆语种和短时语音段识别率较低等问题,为满足不同时长和方言的识别要求,提出基于深度神经网络不同层的有效语音段表示方法.采用含有中间瓶颈层的深层神经网络作为前端特征提取,综合利用该网络的输出层和中间瓶颈层输出结果,得到不同形式的语音段表示并用于语种识别.在美国国家标准技术局语种识别评测2009年和2011年阿拉伯方言数据集上验证了方法的有效性.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
崔瑞莲
宋彦
蒋兵
戴礼荣
关键词 语种识别深度神经网络语音段表示深度瓶颈特征    
Abstract:Aiming at the problems of confusable dialects and short-duration utterance in automatic spoken language identification (LID), an improved utterance representation method is proposed based on different layers of deep neural network (DNN). Deep bottleneck network (DBN), a DNN with an internal bottleneck layer, is employed as a front-end feature extractor. Different representations based on output layer and middle bottleneck layer of DBN for LID are obtained and fused. Evaluations on the NIST LRE2009 dataset and NIST LRE2011 Arabic dialect dataset demonstrate that the proposed method based on DBN achieves good performance.
Key wordsLanguage Identification    Deep Neural Network    Utterance Representation    Deep Bottleneck Feature   
收稿日期: 2014-11-17     
ZTFLH: TN 912.34  
基金资助:国家自然科学基金项目(No.61172158)资助
作者简介: 崔瑞莲(通讯作者),女,1990年生,硕士研究生,主要研究方向为语音信号处理、语种识别.E-mail:cuirl@mail.ustc.edu.cn.宋彦,男,1972年生,博士,讲师,主要研究方向为多媒体信息处理.蒋兵,男,1987年生,博士研究生,主要研究方向为多媒体信息处理.戴礼荣,男,1962年生,博士,教授,主要研究方向为数字信号处理、模式识别.
引用本文:   
崔瑞莲,宋彦,蒋兵,戴礼荣. 基于深度神经网络的语种识别*[J]. 模式识别与人工智能, 2015, 28(12): 1093-1099. CUI Rui-Lian, SONG Yan, JIANG Bing, DAI Li-Rong. Language Identification Based on Deep Neural Network. , 2015, 28(12): 1093-1099.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201512005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2015/V28/I12/1093
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn