模式识别与人工智能
2025年4月2日 星期三   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (1): 130-135    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
连续语音解码阈值参数的优化
尹明明,李弼程,屈丹,牛铜
中国人民解放军信息工程大学信息工程学院郑州450002
Optimization of Decoding Thresholds Parameters in Continuous Speech Recognition
YIN Ming-Ming, LI Bi-Cheng, QU Dan, NIU Tong
School of Information Engineering,Information Engineering University of PLA,Zhengzhou 450002

全文: PDF (436 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对目前连续语音识别解码过程中剪枝阈值的确定不能兼顾解码速度与精度的不足,文中提出一种多维剪枝阈值参数联合优化算法。该算法主要研究全局阈值、词尾阈值、激活模型数、令牌数四维剪枝阈值参数的优化,其优化的主要过程是首先应用多目标优化理论对这四维阈值参数进行联合优化,然后根据优化结果采用分段动态阈值的方法进行后处理。实验结果表明,采用该方法优化后的阈值参数进行一遍解码,解码器的剪枝性能得到明显改善,搜索空间的大小得到有效控制,达到预期的速度与精度权衡的优化效果。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
尹明明
李弼程
屈丹
牛铜
关键词 剪枝阈值连续语音识别解码速度搜索空间令牌传递    
Abstract:As the current pruning thresholds can not take decoding speed and accuracy into account at the same time in continuous speech recognition, a joint optimization algorithm of multi-dimension pruning thresholds parameters is proposed. The pruning thresholds, including the main beam pruning, the word end pruning, the number of active modes and the tokens, are mainly studied in the proposed algorithm. The multi-objectives theory is adopted to optimize these parameters jointly. And then the strategy of segment-based dynamic thresholds pruning is introduced to deal with the results. The experimental results show that the performance of decoder is improved, the search space of decoding gets effective control, and the request of speed and accuracy can be satisfied.
Key wordsPruning Threshold    Continuous Speech Recognition    Decoding Speed    Search Space    Token Passing   
收稿日期: 2011-02-28     
ZTFLH: TP391  
基金资助:国家自然科学基金资助项目(No.60872142,61175017)
作者简介: 尹明明,男,1986年生,硕士研究生,主要研究方向为连续语音识别。E-mail:hiyingmingming@gmail。com。李弼程,男,1970年生,教授,博士生导师,主要研究方向为智能信息处理、语音信号处理。屈丹,女,1976年生,副教授,博士,主要研究方向为语音信号处理。牛铜,男,1983年生,博士,主要研究方向为语音信号处理。
引用本文:   
尹明明,李弼程,屈丹,牛铜. 连续语音解码阈值参数的优化[J]. 模式识别与人工智能, 2012, 25(1): 130-135. YIN Ming-Ming, LI Bi-Cheng, QU Dan, NIU Tong. Optimization of Decoding Thresholds Parameters in Continuous Speech Recognition. , 2012, 25(1): 130-135.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I1/130
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn