[发明专利]语音识别方法、装置、设备及存储介质在审
申请号: | 202211073547.5 | 申请日: | 2022-09-02 |
公开(公告)号: | CN115881108A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 贾敬伍;赵国庆;周长安 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L15/04;G06F40/284;G06F40/242 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 秦贺余;徐敏 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 设备 存储 介质 | ||
本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;基于预设的用户词典和分词器对所述修正语句文本进行语句回测;根据语句回测结果确定对应的语音识别结果。本发明结合同义词词典进行词条匹配,增加对用户口语化表达的泛化匹配能力,同时利用用户词典和分词器对修正语句进行回测验证,确保修正结果的正确性,从而提高了语音识别的准确性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音识别方法、装置、设备及存储介质。
背景技术
ASR(Automatic Speech Recognition),即自动语音识别,是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。
近年来,ASR在许多行业中均有应用。例如,现有的智能问答系统平台通常会用到ASR进行语音转文本,以实现智能客服。但是在实践中,由于客服系统上线后,用户自定义的词汇在原有语料中未曾出现过,尤其是新增业务名称或产品名称,这就导致ASR识别的准确性较差,并进一步导致后续的意图识别、文本匹配的效果也变差,从而影响智能问答的效果。
发明内容
本发明的主要目的在于提供一种语音识别方法、装置、设备及存储介质,旨在解决现有的语音识别方法准确性较差的问题。
为实现上述目的,本发明提供一种语音识别方法,所述语音识别方法包括:
针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;
基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;
基于预设的用户词典和分词器对所述修正语句文本进行语句回测;
根据语句回测结果获得对应的语音识别结果。
可选地,所述对所述初始语句文本进行第一分词处理,得到第一分词结果的步骤,包括:
通过n-gram分词法对所述初始语句文本进行第一分词处理,得到第一分词结果。
可选地,所述第一分词结果包括第一分词词条,所述基于预设的同义词词典对分词结果进行分词匹配的步骤,包括:
基于预设的同义词词典,分别对各第一分词词条进行字符匹配和拼音匹配,得到各第一分词词条对应的词组。
可选地,所述根据匹配情况对所述初始语句文本进行修正,得到修正语句文本的步骤包括:
利用所述词组中的标准词条替换所述第一分词词条,并根据替换结果得到修正语句文本。
可选地,所述基于预设的用户词典和分词器对所述修正语句文本进行语句回测的步骤,包括:
通过所述分词器对所述修正语句文本进行第二分词处理,得到第二分词结果;
通过所述第二分词结果和用户词典进行语句回测,确定所述第二分词结果与标准词条的对应情况。
可选地,所述第二分词结果包括第二分词词条,所述根据语句回测结果确定对应的语音识别结果的步骤,包括:
在所述第二分词词条包含完整的标准词条的情况下,将所述修正语句文本确定为语音识别结果。
此外,为实现上述目的,本发明还提供一种语音识别装置,所述语音识别装置包括:
分词模块10,用于针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211073547.5/2.html,转载请声明来源钻瓜专利网。