[发明专利]一种语音唤醒方法及装置有效
申请号: | 201510549435.6 | 申请日: | 2015-08-31 |
公开(公告)号: | CN105261368B | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 马涛 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G06F1/3206 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张莲莲;黄健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 唤醒 方法 装置 | ||
本发明实施例提供一种语音唤醒方法及装置。该方法包括:对音频信号进行周期性采样,其中,在ti时刻采样得到采样信号;计算采样信号的音频能量;在音频能量大于或等于ti时刻的第一阈值时,唤醒DSP进行语音激活检测VAD;当VAD检测失败,且在ti时刻之前已连续n次检测失败,以及第一噪声能量与ti时刻的第一阈值的差值大于预设的第一门限值时,根据第一噪声能量生成第二阈值,并将第二阈值作为ti+1时刻的第一阈值,其中,第一噪声能量是通过以第一抽取率1/x对采样信号进行抽取,并对抽取出的采样点进行慢速跟踪滤波得到。本发明实施例可以减少进行VAD的次数,实现终端在嘈杂环境下功耗的降低。
技术领域
本发明实施例涉及语音唤醒技术,尤其涉及一种语音唤醒方法及装置。
背景技术
随着科学技术的发展,终端普遍具有语音唤醒功能,使用者使用语音唤醒终端并对其进行相应的语音控制。
目前的语音唤醒方案是采用麦克风激活检测(Microphone Activity Detection,简称:MAD)电路和数字信号处理器(Digital Signal Processor,简称:DSP)两级配合来唤醒终端。其中,如果MAD电路检测到的当前音频信号的能量大于预设阈值,则唤醒DSP进行语音激活检测(Voice Activity Detection,简称:VAD),以通过VAD识别上述音频信号是否为用户的语音;若是,则唤醒终端;若否,DSP唤醒为无效唤醒或误唤醒。具体地,VAD通过比对上述音频信号的特征与用户的语音的特征,来判断语音信号是否为用户的语音。
采用上述语音唤醒方案,当终端处于不同的环境时,例如由安静环境切换到嘈杂环境下,由于预设阈值是固定的,因此经常会出现无效唤醒或者误唤醒的现象,导致终端在嘈杂环境下的功耗偏高。
发明内容
本发明实施例提供一种语音唤醒方法及装置,以降低终端在嘈杂环境下的功耗。
第一方面,本发明实施例提供一种语音唤醒方法,包括:
对音频信号进行周期性采样,其中,在ti时刻采样得到采样信号yi,i为正整数;
计算所述采样信号yi的音频能量Ti;
在所述音频能量Ti大于或等于所述ti时刻的第一阈值A0的情况下,进行语音激活检测VAD;
当VAD已连续n次检测失败,且当VAD检测失败,且在所述ti时刻之前已连续n次检测失败,以及第一噪声能量S0与所述ti时刻的第一阈值A0的差值大于预设的第一门限值M0时,根据所述第一噪声能量S0生成第二阈值A1,并将所述第二阈值A1作为ti+1时刻的第一阈值A0,其中,所述第一噪声能量S0是通过以第一抽取率1/x对所述采样点yi进行抽取,并对抽取出的采样点ys进行慢速跟踪滤波得到,x为大于1的自然数,n为正整数且n小于i。
结合第一方面,在第一方面的第一种可能的实现方式中,所述根据所述第一噪声能量S0生成第二阈值A1,包括:
将所述第一噪声能量S0作为所述第二阈值A1;
或者,将所述第一噪声能量S0与预设的第一修正量N0之和作为所述第二阈值A1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510549435.6/2.html,转载请声明来源钻瓜专利网。