[发明专利]语音识别方法、装置及电子设备有效
申请号: | 201310177246.1 | 申请日: | 2013-05-14 |
公开(公告)号: | CN104157285A | 公开(公告)日: | 2014-11-19 |
发明(设计)人: | 李露;卢鲤;张翔;饶丰;岳帅;陈波;马建雄;刘海波 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 滕一斌 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
从获取到的语音信号中提取音频特征;
根据所述音频特征识别出音节混淆网络;
根据所述音节混淆网络和预设的标音词表生成词语网格;
在所述词语网格中计算最优文字序列作为识别结果。
2.根据权利要求1所述的语音识别方法,其特征在于,所述根据所述音频特征识别出音节混淆网络,包括:
根据所述音频特征识别出包括至少两条音节路径的音节混淆网络;或者,
根据所述音频特征识别出只包括最优音节路径的音节混淆网络。
3.根据权利要求1所述的语音识别方法,其特征在于,所述音节混淆网络包括按序排列的至少一个切片,每个切片包含一组音节,每个音节对应有一个得分,所述根据所述音频混淆网络和预设的标音词表生成词语网格,包括:
遍历所述音节混淆网络中的每个切片在预设的标音词表中所对应的候选文字;
若当前切片中的音节与所述当前切片之后的切片中的音节各自所对应的候选文字组合后是一个词语,则将所述词语生成为一个网格节点,并将所述当前切片中的音节与所述当前切片之后的切片中的音节各自所对应的得分的乘积作为所述网格节点的得分;
若当前切片中的音节与所述当前切片之后的切片中的音节各自所对应的候选文字组合后不是一个词语,则将所述当前切片中的音节所对应的候选文字单独生成为一个网格节点,并将所述当前切片中的音节所对应的得分作为所述网格节点的得分;
将生成的各个网格节点按照各自对应的音节所处的顺序进行相对应的连接,并与开始网格节点和结束网格节点一起生成为词语网格。
4.根据权利要求1所述的语音识别方法,其特征在于,所述词语网格包括开始网格节点、结束网格节点和位于所述开始网格节点和所述结束网格节点之间的至少一条节点路径,所述在所述词语网格中计算最优文字序列作为识别结果,包括:
在所述开始网格节点和所述结束网格节点之间的各条节点路径上分别设置一令牌,并将各个令牌从所述开始网格节点开始向所述结束网格节点逐步移动;
在逐步移动过程中根据途经网格节点的得分和预设的语言模型的概率计算各个令牌的得分;
在抵达所述结束网格节点的各个令牌中选择得分最高的一个令牌所对应的节点路径上的各个网格节点所对应的候选文字组合作为所述最优文字序列。
5.根据权利要求4所述的语音识别方法,其特征在于,所述在逐步移动过程中根据途经网格节点的得分和预设的语言模型的概率计算各个令牌的得分,包括:
对于每一个令牌,根据当前途经网格节点的得分和预设的语言模型的概率计算所述令牌的得分;
检测所述令牌的得分是否小于预设阈值;
若检测结果为所述令牌的得分不小于所述预设阈值,则将所述令牌移动到下一个网格节点并重复上述步骤。
6.根据权利要求4或5任一所述的语音识别方法,其特征在于,所述在逐步移动过程中根据途经网格节点的得分和预设的语言模型的概率计算各个令牌的得分之前,还包括:
根据不同的词表生成并保存至少一个语言模型;
若增加一个词表,则根据增加的所述词表生成新的语言模型,并增加入所述至少一个语言模型中;
若删除一个所述词表,则根据删除的所述词表从所述至少一个语言模型中删除相应的语言模型;
若修改一个所述词表,则根据修改的所述词表生成新的语言模型,并增加入所述至少一个语言模型中,或者,根据修改的所述词表从所述至少一个语言模型中修改相应的语言模型。
7.一种语音识别装置,其特征在于,所述装置包括:
特征提取模块,用于从获取到的语音信号中提取音频特征;
音节识别模块,用于根据所述音频特征识别出音节混淆网络;
网格生成模块,用于根据所述音节混淆网络和预设的标音词表生成词语网格;
文字识别模块,用于在所述词语网格中计算最优文字序列作为识别结果。
8.根据权利要求7所述的装置,其特征在于,所述音节识别模块,用于根据所述音频特征识别出包括至少两条音节路径的音节混淆网络;或者,
所述音节识别模块,用于根据所述音频特征识别出只包括最优音节路径的音节混淆网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310177246.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蓝牙耳机语音识别方法
- 下一篇:一种五指组合控制的新型电子乐器