[发明专利]一种语音识别缺陷检测方法和装置在审
申请号: | 202110701486.1 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113516966A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 韩传宇;孙仿逊;易晖;翁志伟 | 申请(专利权)人: | 肇庆小鹏新能源投资有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 526238 广东省肇庆市肇庆高新区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 缺陷 检测 方法 装置 | ||
1.一种语音识别缺陷检测方法,其特征在于,包括:
接收车载系统转发的语音请求;
对所述语音请求的文本进行意图分类;
根据意图分类结果,对所述文本进行置信度分类;
根据置信度分类结果,从所述文本确定候选词进行筛选,筛选出关键词作为语音识别缺陷。
2.根据权利要求1所述的方法,其特征在于,所述根据意图分类结果,对所述文本进行置信度分类,包括:
根据所述意图分类结果确定所述文本是否具有用户意图;
若根据所述意图分类结果确定所述文本具有用户意图,则对所述文本进行置信度分类。
3.根据权利要求1所述的方法,其特征在于,所述根据置信度分类结果,从所述文本确定候选词进行筛选,筛选出关键词作为语音识别缺陷,包括:
若根据所述置信度分类结果确定所述文本存在错误词,则从所述文本确定候选词进行筛选,筛选出关键词作为语音识别缺陷。
4.根据权利要求2所述的方法,其特征在于,所述对所述语音请求的文本进行意图分类,包括:
采用预设意图分类模型预测所述文本是否具有用户意图,得到预测结果;预测结果包括文本具有用户意图的概率和不具有用户意图的概率。
5.根据权利要求4所述的方法,其特征在于,所述根据所述意图分类结果确定所述文本是否具有用户意图,包括:
根据所述文本具有用户意图的概率和不具有用户意图的概率,判断是否满足预设概率条件;所述预设概率条件包括:具有用户意图的概率大于不具有用户意图的概率,和/或,具有用户意图的概率大于预设概率阈值;
若满足所述预设概率条件,则确定所述文本具有用户意图;
若不满足所述预设概率条件,则确定所述文本不具有用户意图。
6.根据权利要求2所述的方法,其特征在于,所述对所述文本进行置信度分类,包括:
获取所述文本的置信度信息,所述置信度信息包括对所述语音请求进行语音识别得到的所述文本的每个词的置信度;
根据所述置信度信息,对所述文本进行分类,得到置信度分类结果;所述置信度分类结果为文本存在错误词或文本不存在错误词。
7.根据权利要求6所述的方法,其特征在于,所述根据所述置信度信息,对所述文本进行分类,得到置信度分类结果,包括:
判断所述文本的各个词中,是否具有置信度低于预设置信度阈值的词;
若所述文本具有置信度低于预设置信度阈值的词,则确定所述文本存在错误词;
若所述文本不具有置信度低于预设置信度阈值的词,则确定所述文本不存在错误词。
8.根据权利要求6所述的方法,其特征在于,所述根据所述置信度信息,对所述文本进行分类,得到置信度分类结果,包括:
确定所述文本的各个字的置信度和各个字的构词位置;
根据所述文本的各个字的置信度和各个字的构词位置,预测所述文本是否存在错误字;
根据预测结果,确定置信度分类结果。
9.根据权利要求8所述的方法,其特征在于,所述根据所述文本的各个字的置信度和各个字的构词位置,预测所述文本是否存在错误字,包括:
将所述文本的各个字、各个字对应的置信度和各个字的构词位置,输入预设错误预测模型进行处理,得到各个字是否错误的预测结果。
10.根据权利要求1所述的方法,其特征在于,所述从所述文本确定候选词进行筛选,筛选出关键词作为语音识别缺陷,包括:
识别所述文本对应的领域;
分别确定所述文本的各个词,在所述领域的文本中的重要程度;
根据所述文本的各个词在所述领域的文本中的重要程度,确定候选词;
根据所述候选词的词性,筛选出关键词作为语音识别缺陷。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于肇庆小鹏新能源投资有限公司,未经肇庆小鹏新能源投资有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110701486.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:集成电路及其形成方法
- 下一篇:一种硅钙线中硅钙含量的测定方法