[发明专利]语音识别方法、装置、计算机设备及存储介质在审
申请号: | 202110703057.8 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113362827A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 王鹏 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/20;G10L15/26;G06F40/289 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 200000 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
获取待识别语音;
将所述待识别语音输入训练后的语音识别模型进行语音识别处理,得到初始语音识别结果,所述初始语音识别结果包括多个分词预测结果,每个所述分词预测结果包括多个分词预测文本及每个所述分词预测文本对应的分词置信度;
确定所述初始语音识别结果中的所述分词预测文本中是否存在相对应的第一分词预测文本以及第二分词预测文本;
若存在相对应的第一分词预测文本以及第二分词预测文本,则根据所述第二分词预测文本的第二分词置信度对所述第一分词预测文本的第一分词置信度进行调整,得到调整后的分词置信度,所述第二分词置信度高于所述第一分词置信度;
根据所述分词预测文本以及所述调整后的分词置信度确定所述待识别语音的目标语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第二分词预测文本的第二分词置信度对所述第一分词预测文本的第一分词置信度进行调整,得到调整后的分词置信度,包括:
确定所述第一分词置信度是否大于预设的置信度阈值;
若所述第一分词置信度大于所述置信度阈值,则将所述第一分词预测文本的所述第一分词置信度替换为所述第二分词置信度,得到所述调整后的分词置信度。
3.根据权利要求2所述的方法,其特征在于,所述将所述第一分词预测文本的所述第一分词置信度替换为所述第二分词置信度,得到所述调整后的分词置信度,包括:
确定所述第二分词置信度是否大于目标分词预测结果中值最高的置信度,所述目标分词预测结果为所述第一分词预测文本对应的分词预测结果;
若所述第二分词置信度大于目标分词预测结果中值最高的置信度,则将所述第一分词预测文本的所述第一分词置信度替换为所述第二分词置信度,得到所述调整后的分词置信度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述分词预测文本以及所述调整后的分词置信度确定所述待识别语音的目标语音识别结果,包括:
基于所述调整后的分词置信度,将每个所述分词预测结果中置信度最大的分词预测文本确定为目标分词预测文本;
根据所述目标分词预测文本确定所述目标语音识别结果。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述分词预测文本以及所述调整后的分词置信度确定所述待识别语音的目标语音识别结果之后,所述方法还包括:
根据预设的产品词库以及预设的意向词库,分别从所述目标语音识别结果中提取目标产品信息以及目标意向信息;
根据所述目标产品信息以及所述目标意向信息生成数据提取表。
6.根据权利要求5所述的方法,其特征在于,所述根据预设的产品词库以及预设的意向词库,分别从所述目标语音识别结果中提取目标产品信息以及目标意向信息,包括:
对所述目标语音识别结果进行分词处理,得到多个分词;
将所述多个分词中与所述产品词库的产品词相匹配的分词确定为所述目标产品信息;
将所述多个分词中与所述意向词库的意向词相匹配的分词确定为所述目标意向信息。
7.根据权利要求5所述的方法,其特征在于,所述根据所述目标产品信息以及所述目标意向信息生成数据提取表,包括:
提取所述目标产品信息在所述目标语音识别结果中的产品信息位置信息,以及提取所述目标意向信息在所述目标语音识别结果中的意向信息位置信息;
根据所述产品信息位置信息以及所述意向信息位置信息确定所述目标产品信息以及所述目标意向信息的关联关系;
根据所述关联关系生成所述数据提取表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110703057.8/1.html,转载请声明来源钻瓜专利网。