[发明专利]语音识别方法、装置、计算机设备和计算机可读存储介质有效
| 申请号: | 202010004424.0 | 申请日: | 2020-01-03 |
| 公开(公告)号: | CN111145733B | 公开(公告)日: | 2023-02-28 |
| 发明(设计)人: | 茹旷;魏坤 | 申请(专利权)人: | 深圳追一科技有限公司 |
| 主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/06 |
| 代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 蒋学超 |
| 地址: | 518051 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 识别 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请涉及一种语音识别方法、装置、计算机设备和计算机可读存储介质。上述方法包括:获取对音频语句进行语音识别得到的第一词图,及音频语句的上一个语句对应的第二词图;将第一词图和第二词图进行拼接处理,得到目标词图;获取目标语言模型,目标语言模型是基于连续的对话文本训练得到的;基于目标语言模型和目标词图确定音频语句的目标文本表达。采用本方法能够提高语音识别的准确性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种语音识别方法、装置、计算机设备和计算机可读存储介质。
背景技术
随着计算机技术的快速发展,语音识别技术的应用越来越广泛。语音识别技术主要应用于语音搜索、语音输入、语音交互、聊天机器人、设备控制等场景。语音识别技术主要依赖于声学模型和语言模型,通过声学模型将根据语音的音频特征映射到对应的字词,语言模型可以根据识别的字词确定符合语言结构的句子表达。然而,传统的语音识别技术通常是基于获取的语音进行识别,在上下文存在关联时,存在识别准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够识别准确性的语音识别方法、装置、计算机设备和计算机可读存储介质。
一种语音识别方法,所述方法包括:
获取对音频语句进行语音识别得到的第一词图,及所述音频语句的上一个语句对应的第二词图;
将所述第一词图和第二词图进行拼接处理,得到目标词图;
获取目标语言模型,所述目标语言模型是基于连续的对话文本训练得到的;
基于所述目标语言模型和所述目标词图确定所述音频语句的目标文本表达。
在其中一个实施例中,所述基于所述目标语言模型和所述目标词图确定所述音频语句的目标文本表达,包括:
基于所述目标语言模型,对所述目标词图进行重打分,得到所述目标词图包含的各个路径的分数值;
根据分数值最高的路径确定所述目标文本表达。
在其中一个实施例中,所述基于所述目标语言模型,对所述目标词图进行重打分,得到所述目标词图包含的各个路径的分数值,包括:
基于所述目标语言模型,确定所述目标词图包含节点对应的目标语言分数;
根据所述目标词图包含节点对应的声学分数和目标语言分数,确定所述目标词图中由节点组成的路径的分数值。
在其中一个实施例中,所述基于所述目标语言模型,确定所述目标词图包含节点对应的目标语言分数,包括:
获取所述目标词图包含节点对应的初始语言分数;
基于所述目标语言模型,将所述节点对应的初始语言分数替换为目标语言分数。
在其中一个实施例中,所述基于所述目标语言模型,对所述目标词图进行重打分之前,还包括:
根据所述目标词图包含的路径的分数值,从所述目标词图筛选预设数量个候选路径;
基于所述目标语言模型对所述候选路径包含的各个节点进行重打分;
所述根据分数值最高的路径确定所述目标文本表达,包括:
根据重打分后,分数值最高的候选路径确定所述目标文本表达。
在其中一个实施例中,所述基于所述目标语言模型和所述目标词图确定所述音频语句的目标文本表达,还包括:
获取所述第一词图对应的第一说话人标签,及所述第二词图对应的第二说话人标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010004424.0/2.html,转载请声明来源钻瓜专利网。





