[发明专利]语音识别方法、装置、计算机设备和计算机可读存储介质有效

申请号：	202010004424.0	申请日：	2020-01-03
公开（公告）号：	CN111145733B	公开（公告）日：	2023-02-28
发明（设计）人：	茹旷;魏坤	申请（专利权）人：	深圳追一科技有限公司
主分类号：	G10L15/18	分类号：	G10L15/18;G10L15/06
代理公司：	深圳智汇远见知识产权代理有限公司 44481	代理人：	蒋学超
地址：	518051 广东省深圳市南山区粤海街道***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置计算机设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种语音识别方法、装置、计算机设备和计算机可读存储介质。上述方法包括：获取对音频语句进行语音识别得到的第一词图，及音频语句的上一个语句对应的第二词图；将第一词图和第二词图进行拼接处理，得到目标词图；获取目标语言模型，目标语言模型是基于连续的对话文本训练得到的；基于目标语言模型和目标词图确定音频语句的目标文本表达。采用本方法能够提高语音识别的准确性。

技术领域

本申请涉及计算机技术领域，特别是涉及一种语音识别方法、装置、计算机设备和计算机可读存储介质。

背景技术

随着计算机技术的快速发展，语音识别技术的应用越来越广泛。语音识别技术主要应用于语音搜索、语音输入、语音交互、聊天机器人、设备控制等场景。语音识别技术主要依赖于声学模型和语言模型，通过声学模型将根据语音的音频特征映射到对应的字词，语言模型可以根据识别的字词确定符合语言结构的句子表达。然而，传统的语音识别技术通常是基于获取的语音进行识别，在上下文存在关联时，存在识别准确性低的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够识别准确性的语音识别方法、装置、计算机设备和计算机可读存储介质。

一种语音识别方法，所述方法包括：

获取对音频语句进行语音识别得到的第一词图，及所述音频语句的上一个语句对应的第二词图；

将所述第一词图和第二词图进行拼接处理，得到目标词图；

获取目标语言模型，所述目标语言模型是基于连续的对话文本训练得到的；

基于所述目标语言模型和所述目标词图确定所述音频语句的目标文本表达。

在其中一个实施例中，所述基于所述目标语言模型和所述目标词图确定所述音频语句的目标文本表达，包括：

基于所述目标语言模型，对所述目标词图进行重打分，得到所述目标词图包含的各个路径的分数值；

根据分数值最高的路径确定所述目标文本表达。

在其中一个实施例中，所述基于所述目标语言模型，对所述目标词图进行重打分，得到所述目标词图包含的各个路径的分数值，包括：

基于所述目标语言模型，确定所述目标词图包含节点对应的目标语言分数；