模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2015, Vol. 28 Issue (5): 437-442    DOI: 10.16451/j.cnki.issn1003-6059.201505007
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种基于改进得分分布的查询项特定阈值方法*
陆梨花,张连海
中国人民解放军信息工程大学 信息系统工程学院 郑州 450001
A Term Specific Thresholding Method Based on Improved Score Distribution
LU Li-Hua, ZHANG Lian-Hai
Institute of Information System Engineering, PLA Information Engineering University, Zhengzhou 450001

全文: PDF (542 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 为提高语音查询项检索系统的准确率,提出一种基于改进得分分布的查询项特定阈值方法.在系统判决阶段,根据每个查询项的后验得分分布设定不同阈值.后验得分分布用指数混合模型描述,通过无监督的最大期望(EM)算法估计模型参数,最后根据贝叶斯最小风险准则计算阈值.针对EM算法对初始值较为敏感的问题,初始化时采用K-means聚类算法代替随机初始化方法,首先将候选结果得分分为两类,然后计算每类的先验分布并用最大似然法估计模型参数的初始值.实验结果表明该阈值方法有更好的检索性能.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陆梨花
张连海
关键词 得分分布查询项特定阈值K-means聚类语音查询项检索    
Abstract:To improve the precision of the spoken term detection system, a term specific thresholding method based on improved score distribution is presented. At the decision stage of the system, different thresholds are set for every query according to the posterior scores. The distribution of all posterior scores retrieved for a query term is modeled by exponential mixture model. The parameters are estimated by the expectation maximization (EM) algorithm in an unsupervised manner. The threshold value is calculated by Bayes minimum risk rule. Since EM algorithm is sensitive to initial values, K-means clustering is used in the initialization instead of randomization. Posterior scores are firstly divided into two classes, the prior distributions are calculated and the intial values of the model parameters are estimated by maximum likelihood method. The experimental results show that the performance of the proposed thresholding method is better than that of others.
Key wordsScore Distribution    Term Specific Thresholding    K-means Clustering    Spoken Term Detection   
收稿日期: 2014-03-03     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61175017)资助
作者简介: 陆梨花(通讯作者),女,1988年生,硕士研究生,主要研究方向为语音识别与处理.E-mail:lulihua1025@163.com.张连海,男,1972年生,副教授,主要研究方向为语音信号处理、语音识别.
引用本文:   
陆梨花,张连海. 一种基于改进得分分布的查询项特定阈值方法*[J]. 模式识别与人工智能, 2015, 28(5): 437-442. LU Li-Hua, ZHANG Lian-Hai. A Term Specific Thresholding Method Based on Improved Score Distribution. , 2015, 28(5): 437-442.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201505007      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2015/V28/I5/437
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn