[发明专利]语音识别方法、装置、设备及存储介质在审
申请号: | 202211073547.5 | 申请日: | 2022-09-02 |
公开(公告)号: | CN115881108A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 贾敬伍;赵国庆;周长安 | 申请(专利权)人: | 北京中关村科金技术有限公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L15/04;G06F40/284;G06F40/242 |
代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 秦贺余;徐敏 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述语音识别方法包括:
针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;
基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;
基于预设的用户词典和分词器对所述修正语句文本进行语句回测;
根据语句回测结果获得对应的语音识别结果。
2.如权利要求1所述的语音识别方法,其特征在于,所述对所述初始语句文本进行第一分词处理,得到第一分词结果的步骤,包括:
通过n-gram分词法对所述初始语句文本进行第一分词处理,得到第一分词结果。
3.如权利要求1所述的语音识别方法,其特征在于,所述第一分词结果包括第一分词词条,所述基于预设的同义词词典对分词结果进行分词匹配的步骤,包括:
基于预设的同义词词典,分别对各第一分词词条进行字符匹配和拼音匹配,得到各第一分词词条对应的词组。
4.如权利要求3所述的语音识别方法,其特征在于,所述根据匹配情况对所述初始语句文本进行修正,得到修正语句文本的步骤包括:
利用所述词组中的标准词条替换所述第一分词词条,并根据替换结果得到修正语句文本。
5.如权利要求1所述的语音识别方法,其特征在于,所述基于预设的用户词典和分词器对所述修正语句文本进行语句回测的步骤,包括:
通过所述分词器对所述修正语句文本进行第二分词处理,得到第二分词结果;
通过所述第二分词结果和用户词典进行语句回测,确定所述第二分词结果与标准词条的对应情况。
6.如权利要求1所述的语音识别方法,其特征在于,所述第二分词结果包括第二分词词条,所述根据语句回测结果确定对应的语音识别结果的步骤,包括:
在所述第二分词词条包含完整的标准词条的情况下,将所述修正语句文本确定为语音识别结果。
7.一种语音识别装置,其特征在于,所述语音识别装置包括:
分词模块,用于针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;
修正模块,用于基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;
回测模块,用于基于预设的用户词典和分词器对所述修正语句文本进行语句回测;
确定模块,用于根据语句回测结果获得对应的语音识别结果。
8.一种语音识别设备,其特征在于,所述语音识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的语音识别方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的语音识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中关村科金技术有限公司,未经北京中关村科金技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211073547.5/1.html,转载请声明来源钻瓜专利网。