[发明专利]语音识别方法和装置在审
申请号: | 201510920588.7 | 申请日: | 2015-12-11 |
公开(公告)号: | CN105489222A | 公开(公告)日: | 2016-04-13 |
发明(设计)人: | 袁斌;彭守业;徐杨飞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/28;G10L15/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
获取待识别的语音信号的特征;
根据所述特征在构图生成的搜索空间内进行路径搜索,输出解码结果;
根据所述解码结果判断是否需要拒识;
如果需要拒识,则确定语音识别结果是拒识,如果不需要拒识,则根据所 述解码结果获取语音识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述解码结果判 断是否需要拒识,包括:
根据所述解码结果,统计垃圾词和反模型的数量、非意图对象的数量、 关键词的数量和句子长度,并获取每个关键词的置信度;
如果所述垃圾词和反模型的数量大于0,则判断出需要拒识;或者,
确定非意图对象的数量和关键词的数量之和与句子长度的比值,如果 所述比值小于预设比值,则判断出需要拒识;或者,
如果关键词的置信度小于预设置信度值,则判断出需要拒识。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取开发者编辑的内容;
确定所述内容中的意图对象和非意图对象,并获取所述意图对象和非意图 对象对应的反模型和垃圾词模型;
根据所述开发者编辑的内容、所述反模型和垃圾词模型,构图生成搜索空 间。
4.根据权利要求3所述的方法,其特征在于,还包括:
获取语言模型,并在构图生成搜索空间时,在所述搜索空间的静音状态后 加入所述语言模型。
5.根据权利要求3或4所述的方法,其特征在于,还包括:
在所述搜索空间的路径结尾处加入预设标识,以便在路径搜索包含所述预 设标识时,即时输出解码结果。
6.根据权利要求1所述的方法,其特征在于,所述获取待识别的语音信 号的特征,包括:
获取待识别的语音信号;
对所述语音信号进行前端信号处理,所述前端信号处理包括:低频去噪, 和/或,信号增强;
对前端信号处理后的语音信号进行VAD;
对VAD检测出的语音信号进行特征提取,获取所述语音信号的特征。
7.根据权利要求1所述的方法,其特征在于,还包括:
在获取语音识别结果后,重置语音识别的场景。
8.一种语音识别装置,其特征在于,包括:
获取模块,用于获取待识别的语音信号的特征;
解码模块,用于根据所述特征在构图生成的搜索空间内进行路径搜索, 输出解码结果;
判断模块,用于根据所述解码结果判断是否需要拒识;
确定模块,用于如果需要拒识,则确定语音识别结果是拒识,如果不需要 拒识,则根据所述解码结果获取语音识别结果。
9.根据权利要求8所述的装置,其特征在于,所述判断模块具体用于:
根据所述解码结果,统计垃圾词和反模型的数量、非意图对象的数量、 关键词的数量和句子长度,并获取每个关键词的置信度;
如果所述垃圾词和反模型的数量大于0,则判断出需要拒识;或者,
确定非意图对象的数量和关键词的数量之和与句子长度的比值,如果 所述比值小于预设比值,则判断出需要拒识;或者,
如果关键词的置信度小于预设置信度值,则判断出需要拒识。
10.根据权利要求8所述的装置,其特征在于,还包括:
构图模块,用于获取开发者编辑的内容;确定所述内容中的意图对象和非 意图对象,并获取所述意图对象和非意图对象对应的反模型和垃圾词模型;根 据所述开发者编辑的内容、所述反模型和垃圾词模型,构图生成搜索空间。
11.根据权利要求10所述的装置,其特征在于,所述构图模块还用于:
获取语言模型,并在构图生成搜索空间时,在所述搜索空间的静音状态后 加入所述语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510920588.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于麦克风阵列的语音降噪方法及系统
- 下一篇:一种鱼苗分拣筛