[发明专利]智能音箱的待机控制方法在审
申请号: | 201810302821.9 | 申请日: | 2018-04-06 |
公开(公告)号: | CN108429999A | 公开(公告)日: | 2018-08-21 |
发明(设计)人: | 向敏明 | 申请(专利权)人: | 东莞市华睿电子科技有限公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523073 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能音箱 音频信号 待机控制 工作模式 频域信号 语音信号 快速傅里叶变换 待机功耗 密度计算 概率 预设 | ||
本发明公开了一种智能音箱待机控制方法,所述方法包括:智能音箱获取音频信号;对所述音频信号进行快速傅里叶变换得到频域信号;根据所述频域信号计算谱幅度值;根据所述谱幅度值计算概率密度;根据所述概率密度计算所述音频信号的谱熵;根据所述谱熵判断所述音频信号是否为语音信号;若是语音信号,则判断所述语音信号的谱幅度值是否超过预设值;若是则所述智能音箱进入工作模式。本发明可以降低智能音箱的待机功耗,更快速的进入工作模式。
技术领域
本发明数据处理领域,尤其涉及一种智能音箱的待机控制方法。
背景技术
人工智能作为近几年广受关注的领域,其真正意义上的应用场景却是屈指可数。而在这为数不多的应用场景中,智能语音是一个非常重要的方向。而落脚在硬件产品上,智能音箱则是其一个重要的落地产品。
智能音箱作为各种场合下的一个控制中心,其重要性不言而喻,需要其能够在很短的时间内对用户的语音控制指示做出响应,从待机状态进入到工作状态。而这其中,如何识别出语音信号成为一个关键。
现有技术中,对于语音处理来说,其是一个复杂的交叉技术领域。近年来,语音处理技术得到了广泛的应用。语音处理的基础是语音检测,语音检测的目的是检测语音信号是否存在。
现有技术中,语音检测的过程通常是:获取各音频信号,从各音频信号中提取特征参数进行语义分析,再根据语义分析的结果获知该音频信号是否为语音。
但是,语义分析需要进行大量的计算和模板的匹配,影响了语音检测的效率。
发明内容
本发明所要解决的技术问题在于提供一种能够快速响应的智能音箱待机控制方法。
为了解决上述技术问题,本发明提出一种智能音箱待机控制方法,所述方法包括:
获取音频信号;
对所述音频信号进行快速傅里叶变换得到频域信号;
根据所述频域信号计算谱幅度值;
根据所述谱幅度值计算概率密度;
根据所述概率密度计算所述音频信号的谱熵;
根据所述谱熵判断所述音频信号是否为语音信号;
若是语音信号,则判断所述语音信号的谱幅度值是否超过预设值;
若是则所述智能音箱进入工作模式。
其中,所述谱幅度值通过以下方式获得:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
其中,所述根据所述谱幅度值计算概率密度包括:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
其中,所述根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量包括:
其中,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
其中,所述根据所述总能量以及所述谱幅度值计算概率密度包括:
D(k,y)=|X(k,y)|2/Esum(y),D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市华睿电子科技有限公司,未经东莞市华睿电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810302821.9/2.html,转载请声明来源钻瓜专利网。