模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2018, Vol. 31 Issue (7): 662-667    DOI: 10.16451/j.cnki.issn1003-6059.201807009
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于解码多候选结果的半监督数据挑选的语音识别
王兮楼1, 郭武1, 解传栋1
1.中国科学技术大学 语音及语言信息处理国家工程实验室合肥 230027
Speech Recognition Based on Semi-supervised Data Selection via Decoding Multiple Candidate Results
WANG Xilou1, GUO Wu1, XIE Chuandong1
1.National Engineering Laboratory for Speech and Language Information Processing, University of Science and Technology of China, Hefei 230027

全文: PDF (0 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 基于资源稀少情况下的语音识别,提出针对大量无标注数据的半监督学习的挑选策略,应用到声学模型和语言模型建模.采用少量数据训练种子模型后,解码无标注数据.首先在解码的最佳候选结果中采用置信度与困惑度结合的方法挑选高可信的语句训练声学模型及语言模型.进一步对解码得到的格进行转化,得到多候选文本,用于语言模型训练.在日语识别任务上,相比基于置信度挑选数据的方法,文中方法在识别率上具有较大提升.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
王兮楼
郭武
解传栋
关键词 置信度半监督学习多候选低资源    
Abstract:For speech recognition of low resources, a selection strategy for semi-supervised learning with a large number of unlabeled data is proposed, and this strategy is applied to both acoustic modeling and language modeling. After a small amount of data is used to train the seed model, the unlabeled data is decoded using the seed model. Firstly, high-confidence sentences are selected by using a combination of confidence measure and perplexity in the decoded best candidate results. Then, the high-confidence sentences are used to train acoustic model and language model. Furthermore, the decoded lattice is transformed to obtain multiple candidate texts for language model training. In the Japanese recognition task, the proposed method obtains a better recognition rate than the method of selecting data based on confidence measure.
Key wordsConfidence Measure    Semi-supervised Learning    N-BEST    Low Resource   
收稿日期: 2017-11-08     
ZTFLH: TN 912.3  
通讯作者: 王兮楼(通讯作者),硕士研究生,主要研究方向为语音识别.E-mail:zixian@mail.ustc.edu.cn.   
作者简介: 郭 武,博士,副教授,主要研究方向为说话人识别与确认、语音识别.E-mail:guowu@ustc.edu.cn.解传栋,硕士研究生,主要研究方向为语音识别、关键词检索.E-mail:xcdahu@mail.ustc.edu.cn.
引用本文:   
王兮楼, 郭武, 解传栋. 基于解码多候选结果的半监督数据挑选的语音识别[J]. 模式识别与人工智能, 2018, 31(7): 662-667. WANG Xilou, GUO Wu, XIE Chuandong. Speech Recognition Based on Semi-supervised Data Selection via Decoding Multiple Candidate Results. , 2018, 31(7): 662-667.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201807009      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2018/V31/I7/662
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn