[发明专利]一种语音唤醒方法及装置有效

申请号：	201510549435.6	申请日：	2015-08-31
公开（公告）号：	CN105261368B	公开（公告）日：	2019-05-21
发明（设计）人：	马涛	申请（专利权）人：	华为技术有限公司
主分类号：	G10L17/22	分类号：	G10L17/22;G06F1/3206
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	张莲莲;黄健
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音唤醒方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供一种语音唤醒方法及装置。该方法包括：对音频信号进行周期性采样，其中，在t_i时刻采样得到采样信号；计算采样信号的音频能量；在音频能量大于或等于t_i时刻的第一阈值时，唤醒DSP进行语音激活检测VAD；当VAD检测失败，且在t_i时刻之前已连续n次检测失败，以及第一噪声能量与t_i时刻的第一阈值的差值大于预设的第一门限值时，根据第一噪声能量生成第二阈值，并将第二阈值作为t_i+1时刻的第一阈值，其中，第一噪声能量是通过以第一抽取率1/x对采样信号进行抽取，并对抽取出的采样点进行慢速跟踪滤波得到。本发明实施例可以减少进行VAD的次数，实现终端在嘈杂环境下功耗的降低。

技术领域

本发明实施例涉及语音唤醒技术，尤其涉及一种语音唤醒方法及装置。

背景技术

随着科学技术的发展，终端普遍具有语音唤醒功能，使用者使用语音唤醒终端并对其进行相应的语音控制。

目前的语音唤醒方案是采用麦克风激活检测(Microphone Activity Detection，简称：MAD)电路和数字信号处理器(Digital Signal Processor，简称：DSP)两级配合来唤醒终端。其中，如果MAD电路检测到的当前音频信号的能量大于预设阈值，则唤醒DSP进行语音激活检测(Voice Activity Detection，简称：VAD)，以通过VAD识别上述音频信号是否为用户的语音；若是，则唤醒终端；若否，DSP唤醒为无效唤醒或误唤醒。具体地，VAD通过比对上述音频信号的特征与用户的语音的特征，来判断语音信号是否为用户的语音。

采用上述语音唤醒方案，当终端处于不同的环境时，例如由安静环境切换到嘈杂环境下，由于预设阈值是固定的，因此经常会出现无效唤醒或者误唤醒的现象，导致终端在嘈杂环境下的功耗偏高。

发明内容

本发明实施例提供一种语音唤醒方法及装置，以降低终端在嘈杂环境下的功耗。

第一方面，本发明实施例提供一种语音唤醒方法，包括：

对音频信号进行周期性采样，其中，在t_i时刻采样得到采样信号y_i，i为正整数；

计算所述采样信号y_i的音频能量T_i；

在所述音频能量T_i大于或等于所述t_i时刻的第一阈值A₀的情况下，进行语音激活检测VAD；

当VAD已连续n次检测失败，且当VAD检测失败，且在所述t_i时刻之前已连续n次检测失败，以及第一噪声能量S₀与所述t_i时刻的第一阈值A₀的差值大于预设的第一门限值M₀时，根据所述第一噪声能量S₀生成第二阈值A₁，并将所述第二阈值A₁作为t_i+1时刻的第一阈值A₀，其中，所述第一噪声能量S₀是通过以第一抽取率1/x对所述采样点y_i进行抽取，并对抽取出的采样点ys进行慢速跟踪滤波得到，x为大于1的自然数，n为正整数且n小于i。

结合第一方面，在第一方面的第一种可能的实现方式中，所述根据所述第一噪声能量S₀生成第二阈值A₁，包括：

将所述第一噪声能量S₀作为所述第二阈值A₁；

或者，将所述第一噪声能量S₀与预设的第一修正量N₀之和作为所述第二阈值A₁；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华为技术有限公司，未经华为技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510549435.6/2.html，转载请声明来源钻瓜专利网。

上一篇：一种燃烧废气干熄产生可燃高温废气方法
下一篇：手机麦克风的消噪系统和消噪方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音唤醒方法及装置有效

专利文献下载