[发明专利]语音识别方法和装置在审

申请号：	201510920588.7	申请日：	2015-12-11
公开（公告）号：	CN105489222A	公开（公告）日：	2016-04-13
发明（设计）人：	袁斌;彭守业;徐杨飞	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/28;G10L15/02
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	宋合成
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音识别方法，其特征在于，包括：

获取待识别的语音信号的特征；

根据所述特征在构图生成的搜索空间内进行路径搜索，输出解码结果；

根据所述解码结果判断是否需要拒识；

如果需要拒识，则确定语音识别结果是拒识，如果不需要拒识，则根据所述解码结果获取语音识别结果。

2.根据权利要求1所述的方法，其特征在于，所述根据所述解码结果判断是否需要拒识，包括：

根据所述解码结果，统计垃圾词和反模型的数量、非意图对象的数量、关键词的数量和句子长度，并获取每个关键词的置信度；

如果所述垃圾词和反模型的数量大于0，则判断出需要拒识；或者，

确定非意图对象的数量和关键词的数量之和与句子长度的比值，如果所述比值小于预设比值，则判断出需要拒识；或者，

如果关键词的置信度小于预设置信度值，则判断出需要拒识。

3.根据权利要求1所述的方法，其特征在于，还包括：

获取开发者编辑的内容；

确定所述内容中的意图对象和非意图对象，并获取所述意图对象和非意图对象对应的反模型和垃圾词模型；

根据所述开发者编辑的内容、所述反模型和垃圾词模型，构图生成搜索空间。

4.根据权利要求3所述的方法，其特征在于，还包括：

获取语言模型，并在构图生成搜索空间时，在所述搜索空间的静音状态后加入所述语言模型。

5.根据权利要求3或4所述的方法，其特征在于，还包括：

在所述搜索空间的路径结尾处加入预设标识，以便在路径搜索包含所述预设标识时，即时输出解码结果。

6.根据权利要求1所述的方法，其特征在于，所述获取待识别的语音信号的特征，包括：

获取待识别的语音信号；

对所述语音信号进行前端信号处理，所述前端信号处理包括：低频去噪，和/或，信号增强；

对前端信号处理后的语音信号进行VAD；

对VAD检测出的语音信号进行特征提取，获取所述语音信号的特征。

7.根据权利要求1所述的方法，其特征在于，还包括：

在获取语音识别结果后，重置语音识别的场景。

8.一种语音识别装置，其特征在于，包括：

获取模块，用于获取待识别的语音信号的特征；

解码模块，用于根据所述特征在构图生成的搜索空间内进行路径搜索，输出解码结果；

判断模块，用于根据所述解码结果判断是否需要拒识；

确定模块，用于如果需要拒识，则确定语音识别结果是拒识，如果不需要拒识，则根据所述解码结果获取语音识别结果。

9.根据权利要求8所述的装置，其特征在于，所述判断模块具体用于：

根据所述解码结果，统计垃圾词和反模型的数量、非意图对象的数量、关键词的数量和句子长度，并获取每个关键词的置信度；

如果所述垃圾词和反模型的数量大于0，则判断出需要拒识；或者，

确定非意图对象的数量和关键词的数量之和与句子长度的比值，如果所述比值小于预设比值，则判断出需要拒识；或者，

如果关键词的置信度小于预设置信度值，则判断出需要拒识。

10.根据权利要求8所述的装置，其特征在于，还包括：

构图模块，用于获取开发者编辑的内容；确定所述内容中的意图对象和非意图对象，并获取所述意图对象和非意图对象对应的反模型和垃圾词模型；根据所述开发者编辑的内容、所述反模型和垃圾词模型，构图生成搜索空间。

11.根据权利要求10所述的装置，其特征在于，所述构图模块还用于：

获取语言模型，并在构图生成搜索空间时，在所述搜索空间的静音状态后加入所述语言模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510920588.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于麦克风阵列的语音降噪方法及系统
下一篇：一种鱼苗分拣筛

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别方法和装置在审

专利文献下载