[发明专利]离线语音识别的阈值自适应调整方法有效
申请号: | 201810102936.3 | 申请日: | 2018-02-01 |
公开(公告)号: | CN108550365B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 陈晓松;鲍晴峰 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/22;G10L15/065 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离线 语音 识别 阈值 自适应 调整 方法 | ||
本发明公开的离线语音识别的阈值自适应调整方法,包括步骤:设定基础阈值和补偿阈值,其中,基础阈值包括第一阈值和第二阈值;根据所设定的基础阈值和补偿阈值,对所有待识别目标进行语音识别第一次语音识别和第二次语音识别;统计识别结果整体的第二次语音识别的识别命中比率;调整基础阈值,使所述整体的第二次语音识别的识别命中比率处于第一预设范围之内;统计识别结果中的每个单一识别目标的第二次语音识别的识别命中比率;调整用于所述单一识别目标的补偿阈值,使所述单一识别目标的第二次语音识别的识别命中比率处于第二预设范围之内。
技术领域
本发明涉及语音识别技术领域,特别涉及一种离线语音识别的阈值自适应调整方法。
背景技术
在语音识别领域,有着良好表现的都是运算能力强、存储空间大的在线识别,而离线语音识别由于受到硬件性能的限制,往往用于限定范围内语音识别,在需要识别的语音有限时的表现较好,而在用于一般情况的识别时,识别率会明显降低。
目前,由于硬件的限制,离线语音识往往不会考虑被识别的语音中的噪音情况等,往往用相同的设定去识别不同背景噪音下的语音,如将识别引擎返回结果的打分值与固定的阈值进行比较,以此决定识别结果是否可用,从而一定程度上影响了语音识别的准确性,导致容易出现误识别或识别率低的问题。
发明内容
为解决以上问题,本发明提供了一种离线语音识别的阈值自适应调整方法,通过自动调整离线语音识别中的阈值来提高离线语音识别的准确性。本发明提供的一种离线语音识别的阈值自适应调整方法,包括步骤:
设定基础阈值和补偿阈值,其中,基础阈值包括第一阈值和第二阈值,所述第一阈值,与补偿阈值之和用于进行第一次语音识别;所述第二阈值,与补偿阈值之和用于进行第二次语音识别;
根据所设定的基础阈值和补偿阈值,对所有待识别目标进行语音识别第一次语音识别和第二次语音识别;
统计识别结果整体的第二次语音识别的识别命中比率;
当所述整体的第二次语音识别的识别命中比率处于第一预设范围之外时,调整基础阈值,使所述整体的第二次语音识别的识别命中比率处于第一预设范围之内;
统计识别结果中的每个单一识别目标的第二次语音识别的识别命中比率;
当存在某个单一识别目标的第二次语音识别的识别命中比率处于第二预设范围之外时,调整用于所述单一识别目标的补偿阈值,使所述单一识别目标的第二次语音识别的识别命中比率处于第二预设范围之内。
优选的,所述调整基础阈值,使所述整体的第二次语音识别的识别命中比率处于第一预设范围之内,具体实施为,
当所述整体的第二次语音识别的识别命中比率小于第一预设范围的下限时,提高基础阈值,使所述整体的第二次语音识别的识别命中比率处于第一预设范围之内;
当所述整体的第二次语音识别的识别命中比率大于第一预设范围的上限时,降低基础阈值,使所述整体的第二次语音识别的识别命中比率处于第一预设范围之内。
优选的,所述第二预设范围,其下限为0。
优选的,所述调整用于所述单一识别目标的补偿阈值,使所单一识别目标的第二次语音识别的识别命中比率处于第二预设范围之内,具体实施为,
当某个单一识别目标的第二次语音识别的识别命中比率大于第二预设范围的上限时,降低用于所述单一识别目标的补偿阈值,使所述单一识别目标的第二次语音识别的识别命中比率处于第二预设范围之内。
优选的,所述补偿阈值,其初始值为0。
优选的,
所述提高基础阈值,具体实施为,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810102936.3/2.html,转载请声明来源钻瓜专利网。