[发明专利]语音识别方法和装置有效
申请号: | 201510958150.8 | 申请日: | 2015-12-18 |
公开(公告)号: | CN105513589B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 黄辰;钱胜 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/183 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
本申请公开了语音识别方法和装置。所述方法的一具体实施方式包括:将待识别的语音信息切分多帧语音片段;通过预设的解码网络,对语音片段逐帧进行声学模型打分和语言模型查分;基于得分结果,将解码网络中的至少一条解码路径对应的词序列,确定为语音识别结果;其中,在对一帧语音片段进行语言模型查分时,依次进行第一语言模型查分和第二语言模型查分。该实施方式实现了准确、高效的语音识别。
技术领域
本申请涉及计算机技术领域,具体涉及人工智能技术领域,尤其涉及语音识别方法和装置。
背景技术
语音识别技术是一种将人类的语音中的词汇内容转换为计算机可读的输入(例如按键、二进制编码或者字符序列)的技术。在语音识别系统中,解码器是一个相当重要的组成部分。解码器可以通过加载训练好的声学模型以及语言模型,在解码网络中寻找最优的路径,将其对应的文本信息作为识别结果。
在目前的语音识别系统中,为了取得更高的识别率,都会尽可能使用较大的语言模型进行查分。但是,如果直接使用超大语言模型进行查分,会对存储该语言模型的磁盘造成较大损耗,并且识别效率会明显降低。因此,现有技术中普遍采用两遍解码策略进行解码。第一遍可以在小语言模型上完成解码,生成词图(lattice)。第二遍则可以在词图上再使用大语言模型重新打分。此时,由于词图较小,因此需要查询大语言模型的次数也较少,从而能够明显提高语音识别的效率。
但是,由于这种方法在第一遍解码时使用了准确度较低的小语言模型,通过其进行多次查分所累积的误差会导致词图中损失部分语音信息。这样,即使后续再从词图上使用大语言模型重新打分,也挽回不了之前损失的信息,因此导致语音识别的准确率不够高的问题。
发明内容
本申请的目的在于提出一种语音识别方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种语音识别方法,所述方法包括:将待识别的语音信息切分多帧语音片段;通过预设的解码网络,对所述语音片段逐帧进行声学模型打分和语言模型查分;基于得分结果,将所述解码网络中的至少一条解码路径对应的词序列,确定为语音识别结果;其中,在对一帧语音片段进行语言模型查分时,依次进行第一语言模型查分和第二语言模型查分。
在一些实施例中,所述第一语言模型是通过对所述第二语言模型进行裁剪得到的。
在一些实施例中,通过预设的解码网络,对所述语音片段逐帧进行声学模型打分和语言模型查分,包括:基于所述解码网络,针对当前输入的一帧语音片段执行如下解码步骤:确定第一激活节点集合,所述第一激活节点集合中包括所述解码网络中的至少一个节点;遍历所述第一激活节点集合中的各个节点及对应的后驱节点,并在所述遍历过程中对当前语音片段进行声学模型打分或声学模型打分和第一语言模型查分;基于所述当前语音片段的得分,计算每个所述节点及对应的后驱节点的分数;根据每个所述节点及对应的后驱节点的分数,确定第二激活节点集合,所述第二激活节点集合中包括所述第一激活节点集合中的各个节点及对应的后驱节点中的至少一个节点;若第二激活节点集合中存在出词节点,则遍历所述出词节点,并在该遍历过程中进行第二语言模型查分;根据所述第二语言模型查分的结果,重新计算所述出词节点的分数;基于所述出词节点的分数,对所述第二激活节点集合中的节点进行裁剪;将裁剪后的所述第二激活节点集合作为下一帧语音片段的第一激活节点集合,对所述下一帧语音片段再次执行所述解码步骤。
在一些实施例中,若当前输入的一帧语音片段为所述语音信息的第一帧语音片段,则所述第一激活节点集合包括所述解码网络的起始节点。
在一些实施例中,所述基于得分结果,将所述解码网络中的至少一条解码路径对应的词序列,确定为语音识别结果,包括:基于所述解码网络中终止节点的得分,获取至少一条解码路径;将所述解码路径对应的词序列确定为语音识别结果。
在一些实施例中,所述第二语言模型存储于具有预定读写速度的硬件上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510958150.8/2.html,转载请声明来源钻瓜专利网。