[发明专利]语音识别方法和装置在审
申请号: | 201510920588.7 | 申请日: | 2015-12-11 |
公开(公告)号: | CN105489222A | 公开(公告)日: | 2016-04-13 |
发明(设计)人: | 袁斌;彭守业;徐杨飞 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/28;G10L15/02 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
技术领域
本发明涉及语音技术领域,尤其涉及一种语音识别方法和装置。
背景技术
语音技术可以为人们提供非常方便的用户体验,尤其是在移动端和可穿戴 设备上。目前语音识别技术主要是通过线上服务进行识别,但是如果在没有网 络或者网络不稳定情况下,在线服务便不能够满足需求,并且传统的离线语音 识别系统识别不具有拒识效果。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种语音识别方法,该方法具有很好的 拒识效果。
本发明的另一个目的在于提出一种语音识别装置。
为达到上述目的,本发明第一方面实施例提出的语音识别方法,包括:获 取待识别的语音信号的特征;根据所述特征在构图生成的搜索空间内进行路 径搜索,输出解码结果;根据所述解码结果判断是否需要拒识;如果需要拒 识,则确定语音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取 语音识别结果。
本发明第一方面实施例提出的语音识别方法,通过判断是否需要拒识, 在需要时进行拒识处理,可以具有较好的拒识效果,同时由于存在拒识情 况,可以提高识别精度。
为达到上述目的,本发明第二方面实施例提出的语音识别装置,包括:获 取模块,用于获取待识别的语音信号的特征;解码模块,用于根据所述特征 在构图生成的搜索空间内进行路径搜索,输出解码结果;判断模块,用于根 据所述解码结果判断是否需要拒识;确定模块,用于如果需要拒识,则确定语 音识别结果是拒识,如果不需要拒识,则根据所述解码结果获取语音识别结果。
本发明第二方面实施例提出的语音识别装置,通过判断是否需要拒识, 在需要时进行拒识处理,可以具有较好的拒识效果,同时由于存在拒识情 况,可以提高识别精度。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描 述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中 将变得明显和容易理解,其中:
图1是本发明一实施例提出的语音识别方法的流程示意图;
图2是本发明实施例中获取语音信号的特征的流程示意图;
图3是本发明实施例中构图的流程示意图;
图4是本发明实施例中构图生成的一种搜索空间的示意图;
图5是本发明另一实施例提出的语音识别方法的流程示意图;
图6是本发明另一实施例提出的语音识别装置的结构示意图;
图7是本发明另一实施例提出的语音识别装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自 始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模 块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能 理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的 精神和内涵范围内的所有变化、修改和等同物。
图1是本发明一实施例提出的语音识别方法的流程示意图,该方法包 括:
S11:获取待识别的语音信号的特征。
例如,参见图2,获取语音信号的特征的流程可以包括:
S21:获取待识别的语音信号。
以车载设备进行离线语音识别为例,可以由车载设备的麦克风检测待 识别的语音信号。
可以理解的是,本发明将以离线语音识别为例,由客户端本地执行。 但是,本发明的方法也可以应用于在线语音识别,由在线语音识别的服务 端执行。
S22:对所述语音信号进行前端信号处理,所述前端信号处理包括:低频 去噪,和/或,信号增强。
例如,在车载或者音乐、空调、以及风声等噪声比较强以及远场等环 境下,如果将原始信号直接送入到解码器当中,效果非常不好,所以需要 在声音进入到解码器之前,首先对原始信号进行低频去噪以消除汽车行驶 过程中产生的低频噪声,同时由于用户在车载等环境下往往离麦克风的距 离较远或者由于硬件等原因会导致声音音量过小,可以采用信号幅度增强 技术对原始的声音信号幅度进行放大操作。通过前端信号处理后的语音信 号具有非常良好的抗噪性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510920588.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于麦克风阵列的语音降噪方法及系统
- 下一篇:一种鱼苗分拣筛