[发明专利]具有解耦唤醒短语的语音识别系统和方法有效
申请号: | 201780091695.0 | 申请日: | 2017-10-24 |
公开(公告)号: | CN110809796B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 黄辰 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 100193 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 唤醒 短语 语音 识别 系统 方法 | ||
1.一种语音识别方法,由服务器实现,所述方法包括:
将关键短语添加到包括至少两个字典短语的字典中,所述关键短语和所述字典短语各包括一个或以上字;以及
对于所述字典短语的每一个或以上,获得在短语序列中所述字典短语在所述关键短语之后的第一概率,其中所述第一概率独立于所述关键短语;
基于至少一个第一概率确定所述短语序列的整体概率分数;根据所述整体概率分数识别输入音频对应的短语序列。
2.根据权利要求1所述的语音识别方法,其特征在于:
所述方法适用于语音识别的语音模型;以及
所述语音模型包括N-gram模型。
3.根据权利要求2所述的语音识别方法,其特征在于:
N是大于1的自然数。
4.根据权利要求2所述的语音识别方法,其特征在于:
所述短语序列以所述关键短语开始,且包括在所述关键短语后的N-1个其他字典短语;
所述N-1个其他字典短语包括第一字典短语并以所述第一字典短语结尾;以及
所述第一字典短语的所述第一概率取决于所述短语序列中所述第一字典短语之前的一个或以上字典短语,且不依赖于所述关键短语。
5.根据权利要求2所述的语音识别方法,其特征在于:
所述短语序列以所述关键短语开始,且包括在所述关键短语后的第二字典短语;以及
所述第二字典短语的所述第一概率取决于以所述第二字典短语开始的句子,且不依赖于所述关键短语。
6.根据权利要求2所述的语音识别方法,其特征在于,在获得所述第一概率之前,所述方法进一步包括:
对于所述关键短语,获得与以所述关键短语开始的短语序列相关的第二概率,其中所述第二概率大于以另一个字典短语开始的短语序列的另一概率。
7.根据权利要求6所述的语音识别方法,其特征在于:
所述关键短语和所述字典短语与语言模型相关联,每个语言模型将所述短语与所述短语的一个或以上发音元素相联系。
8.根据权利要求7所述的语音识别方法,其特征在于,进一步包括:
获得包括所述关键短语和在所述关键短语之后的一个或以上字典短语的音频记录;
至少基于所述语言模型,识别所述关键短语并确定一个或以上候选字典短语;以及
至少基于所述语音模型,从所述一个或以上候选字典短语中以所述音频记录的时间顺序确定一个或以上字典短语。
9.根据权利要求7所述的语音识别方法,其特征在于:
对于所述关键短语和字典短语中的每一个,所述发音元素包括一个或以上音位。
10.一种语音识别系统,包括:
一个处理器;以及
一个存储指令的非暂时性计算机可读存储介质,当所述处理器执行所述指令时,使所述处理器:
将关键短语添加到包括至少两个字典短语的字典中,所述关键短语和所述字典短语各包括一个或以上字;以及
对于所述字典短语的每一个或以上,获得在短语序列中所述字典短语在所述关键短语之后的第一概率,其中所述第一概率独立于所述关键短语;
基于至少一个第一概率确定所述短语序列的整体概率分数;根据所述整体概率分数识别输入音频对应的短语序列。
11.根据权利要求10所述的语音识别系统,其特征在于:
所述系统适用于语音识别的语音模型;以及
所述语音模型包括N-gram模型。
12.根据权利要求11所述的语音识别系统,其特征在于:
N是大于1的自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780091695.0/1.html,转载请声明来源钻瓜专利网。