[发明专利]语音识别方法、装置、计算机设备和计算机可读存储介质有效
| 申请号: | 202010004424.0 | 申请日: | 2020-01-03 | 
| 公开(公告)号: | CN111145733B | 公开(公告)日: | 2023-02-28 | 
| 发明(设计)人: | 茹旷;魏坤 | 申请(专利权)人: | 深圳追一科技有限公司 | 
| 主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/06 | 
| 代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 蒋学超 | 
| 地址: | 518051 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种语音识别方法,所述方法包括:
获取对音频语句进行语音识别得到的第一词图,及所述音频语句的上一个语句对应的第二词图;所述音频语句的上一个语句和所述音频语句具有上下文关系;
将所述第一词图和第二词图进行拼接处理,得到目标词图;
获取目标语言模型,所述目标语言模型是基于连续的对话文本训练得到的;所述目标语言模型的训练过程,包括:获取训练文本,所述训练文本是由多个连续的对话文本拼接得到的;将所述训练文本输入目标语言模型,通过所述目标语言模型基于所述训练文本中的第一文本输出预测文本;根据所述预测文本与第二文本之间的差异值调整所述目标语言模型的参数,直至所述预测文本与所述第二文本之间的差异值低于差异阈值;其中,所述第二文本为与所述第一文本的相邻的下一文本;
根据所述目标语言模型确定的上下文信息对所述目标词图中相邻字词之间的节点的分数值进行调整,将可信度较高的相邻字词之间的节点的分数调高,将可信度较低的相邻字词之间的分数调低,得到所述目标词图包含的各个路径的调整后的分数值;
根据调整后的分数值最高的路径确定所述目标文本表达。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述目标语言模型确定的上下文信息对所述目标词图中相邻字词之间的节点的分数值进行调整之前,所述方法还包括:
基于所述目标语言模型,确定所述目标词图包含节点对应的目标语言分数;
根据所述目标词图包含节点对应的声学分数和目标语言分数,确定所述目标词图中由节点组成的路径的分数值。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标语言模型,确定所述目标词图包含节点对应的目标语言分数,包括:
获取所述目标词图包含节点对应的初始语言分数;
基于所述目标语言模型,将所述节点对应的初始语言分数替换为目标语言分数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标语言模型确定的上下文信息对所述目标词图中相邻字词之间的节点的分数值进行调整包括:
根据所述目标词图包含的路径的分数值,从所述目标词图筛选预设数量个候选路径;
根据所述目标语言模型确定的上下文信息对所述目标词图中的所述候选路径所包含的相邻字词之间的节点的分数值进行调整。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述第一词图对应的第一说话人标签,及所述第二词图对应的第二说话人标签;
基于所述目标语言模型,结合所述第一说话人标签、第二说话人标签对目标词图包含的各个节点的分数进行调整。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标语言模型确定的上下文信息对所述目标词图中相邻字词之间的节点的分数值进行调整包括:
将所述目标语言模型转换为图结构语言模型;
根据图结构语言模型确定的上下文信息对所述目标词图中相邻字词之间的节点的分数值进行调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010004424.0/1.html,转载请声明来源钻瓜专利网。





