[发明专利]语音识别方法、装置、设备及存储介质有效
申请号: | 201910822237.0 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110517682B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 朱振岭 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/18 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 设备 存储 介质 | ||
本申请提供了一种语音识别方法、装置、设备及存储介质,其中,所述方法包括:对采集的第一语音信息进行ADBF处理,得到在至少两个方向上的频谱;在所述至少两个方向上的频谱中,将频谱特征满足预设条件的频谱所对应的方向,确定为目标方向;获取在所述目标方向采集的第二语音信息,并对所述第二语音信息进行语音识别。通过本申请,能够获取准确方向上的第二语音信息,提高语音识别的准确率。
技术领域
本申请涉及电子设备技术领域,涉及但不限于一种语音识别方法、装置、设备及存储介质。
背景技术
目前,对于具有语音识别功能的电子设备,在实现语音识别功能时,其前端的信号处理过程通常是将麦克风所采集的信号进行回声消除和单通道降噪,得到处理后的信号,并根据处理后的信号对电子设备进行唤醒,在电子设备被唤醒之后,进行语音识别。
但是,相关技术中的语音识别方法,通过回声消除(Acoustic EchoCancellation,AEC)和单通道降噪(Noise suppression,NS)处理之后的信号中包括其他方向的方向性干扰噪声,而在干扰较大或者高混响的情况下容易出现声源定位不准确的问题,从而会导致之后的语音识别的准确率降低。
发明内容
本申请实施例提供一种语音识别方法、装置、设备及存储介质,能够准确定位声源的方向,从而提高语音识别的准确率。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种语音识别方法,包括:
对采集的第一语音信息进行ADBF处理,得到在至少两个方向上的频谱;
在所述至少两个方向上的频谱中,将频谱特征满足预设条件的频谱所对应的方向,确定为目标方向;
获取在所述目标方向采集的第二语音信息,并对所述第二语音信息进行语音识别。
本申请实施例提供一种语音识别装置,包括:
第一处理模块,用于对采集的第一语音信息进行ADBF处理,得到在至少两个方向上的频谱;
确定模块,用于在所述至少两个方向上的频谱中,将频谱特征满足预设条件的频谱所对应的方向,确定为目标方向;
第二处理模块,用于获取在所述目标方向采集的第二语音信息,并对所述第二语音信息进行语音识别。
本申请实施例提供一种语音识别设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现上述的方法。
本申请实施例提供一种存储介质,存储有可执行指令,用于引起处理器执行时,实现上述的方法。
本申请实施例具有以下有益效果:
对采集的第一语音信息进行ADBF处理,得到在至少两个方向上的频谱;并在所述至少两个方向上的频谱中,将频谱特征满足预设条件的频谱所对应的方向,确定为目标方向,这样,能够准确的定位声源的方向,从而在后续的语音识别过程中,能够获取准确方向上的第二语音信息,提高语音识别的准确率。
附图说明
图1为相关技术中的语音识别方法的实现流程示意图;
图2A为本申请实施例提供的语音识别系统的一个可选的架构示意图;
图2B为本申请实施例提供的服务器的结构示意图;
图3A为本申请实施例提供的语音识别方法的一个可选的流程示意图;
图3B为本申请实施例提供的语音识别方法的一个可选的场景示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910822237.0/2.html,转载请声明来源钻瓜专利网。