[发明专利]语音识别方法、装置、设备及存储介质在审

申请号：	202211073547.5	申请日：	2022-09-02
公开（公告）号：	CN115881108A	公开（公告）日：	2023-03-31
发明（设计）人：	贾敬伍;赵国庆;周长安	申请（专利权）人：	北京中关村科金技术有限公司
主分类号：	G10L15/197	分类号：	G10L15/197;G10L15/04;G06F40/284;G06F40/242
代理公司：	北京万思博知识产权代理有限公司 11694	代理人：	秦贺余;徐敏
地址：	100080 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括：针对待识别语音，获取对应的初始语句文本，并对所述初始语句文本进行第一分词处理，得到第一分词结果；基于预设的同义词词典对所述第一分词结果进行分词匹配，并根据匹配情况对所述初始语句文本进行修正，得到修正语句文本；基于预设的用户词典和分词器对所述修正语句文本进行语句回测；根据语句回测结果确定对应的语音识别结果。本发明结合同义词词典进行词条匹配，增加对用户口语化表达的泛化匹配能力，同时利用用户词典和分词器对修正语句进行回测验证，确保修正结果的正确性，从而提高了语音识别的准确性。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种语音识别方法、装置、设备及存储介质。

背景技术

ASR(Automatic Speech Recognition)，即自动语音识别，是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列等。

近年来，ASR在许多行业中均有应用。例如，现有的智能问答系统平台通常会用到ASR进行语音转文本，以实现智能客服。但是在实践中，由于客服系统上线后，用户自定义的词汇在原有语料中未曾出现过，尤其是新增业务名称或产品名称，这就导致ASR识别的准确性较差，并进一步导致后续的意图识别、文本匹配的效果也变差，从而影响智能问答的效果。

发明内容

本发明的主要目的在于提供一种语音识别方法、装置、设备及存储介质，旨在解决现有的语音识别方法准确性较差的问题。

为实现上述目的，本发明提供一种语音识别方法，所述语音识别方法包括：

针对待识别语音，获取对应的初始语句文本，并对所述初始语句文本进行第一分词处理，得到第一分词结果；

基于预设的同义词词典对所述第一分词结果进行分词匹配，并根据匹配情况对所述初始语句文本进行修正，得到修正语句文本；

基于预设的用户词典和分词器对所述修正语句文本进行语句回测；

根据语句回测结果获得对应的语音识别结果。

可选地，所述对所述初始语句文本进行第一分词处理，得到第一分词结果的步骤，包括：

通过n-gram分词法对所述初始语句文本进行第一分词处理，得到第一分词结果。

可选地，所述第一分词结果包括第一分词词条，所述基于预设的同义词词典对分词结果进行分词匹配的步骤，包括：

基于预设的同义词词典，分别对各第一分词词条进行字符匹配和拼音匹配，得到各第一分词词条对应的词组。

可选地，所述根据匹配情况对所述初始语句文本进行修正，得到修正语句文本的步骤包括：