[发明专利]离线语音识别的阈值自适应调整方法有效
申请号: | 201810102936.3 | 申请日: | 2018-02-01 |
公开(公告)号: | CN108550365B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 陈晓松;鲍晴峰 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/22;G10L15/065 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离线 语音 识别 阈值 自适应 调整 方法 | ||
1.一种离线语音识别的阈值自适应调整方法,其特征在于,包括步骤:
设定基础阈值和补偿阈值,其中,基础阈值包括第一阈值和第二阈值,所述第一阈值,其与补偿阈值之和用于进行第一次语音识别;所述第二阈值,其与补偿阈值之和用于进行第二次语音识别;
根据所设定的基础阈值和补偿阈值,对所有待识别目标进行语音识别第一次语音识别和第二次语音识别;
统计识别结果整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比;
当所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第一预设范围之外时,调整基础阈值,使所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第一预设范围之内;
统计识别结果中的每个单一识别目标的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比;
当存在某个单一识别目标的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第二预设范围之外时,调整用于所述单一识别目标的补偿阈值,使所述单一识别目标的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第二预设范围之内。
2.根据权利要求1所述的方法,其特征在于,所述调整基础阈值,使所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第一预设范围之内,具体实施为,
当所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比小于第一预设范围的下限时,提高基础阈值,使所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第一预设范围之内;
当所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比大于第一预设范围的上限时,降低基础阈值,使所述整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第一预设范围之内。
3.根据权利要求1所述的方法,其特征在于,所述第二预设范围,其下限为0。
4.根据权利要求3所述的方法,其特征在于,所述调整用于所述单一识别目标的补偿阈值,使所单一识别目标的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第二预设范围之内,具体实施为,
当某个单一识别目标的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比大于第二预设范围的上限时,降低用于所述单一识别目标的补偿阈值,使所述单一识别目标的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比处于第二预设范围之内。
5.根据权利要求1所述的方法,其特征在于,所述补偿阈值,其初始值为0。
6.根据权利要求2所述的方法,其特征在于,
所述提高基础阈值,具体实施为,
比较当前的整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比与第一预设范围的中值,得到其差值的绝对值,作为第一差值;
用所述第一差值乘以预设的第一调整因子,作为基础阈值的第一调整系数,所述第一调整因子为正值;
用所述基础阈值的第一调整系数乘以原基础阈值,并与原基础阈值相加,得到新的基础阈值;
所述降低基础阈值,具体实施为,
比较当前的整体的第二次语音识别成功识别的数量与第一次语音识别成功识别的数量之比与第一预设范围的中值,得到其差值的绝对值,作为第二差值;
用所述第二差值乘以预设的第二调整因子,作为基础阈值的第二调整系数,所述第二调整因子为负值;
用所述基础阈值的第二调整系数乘以原基础阈值,并与原基础阈值相加,得到新的基础阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810102936.3/1.html,转载请声明来源钻瓜专利网。