[发明专利]音频检测方法、装置、存储介质及电子装置在审

专利信息
申请号: 202010617430.3 申请日: 2020-06-30
公开(公告)号: CN111883181A 公开(公告)日: 2020-11-03
发明(设计)人: 张晓萌;马路;赵培;苏腾荣 申请(专利权)人: 海尔优家智能科技(北京)有限公司
主分类号: G10L25/78 分类号: G10L25/78;G10L25/84;G10L25/30
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 赵静
地址: 100086 北京市海淀区知春*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 检测 方法 装置 存储 介质 电子
【说明书】:

发明实施例提供了一种音频检测方法、装置、存储介质及电子装置,其中,该方法包括:获取目标音频的信号特征;使用第一模型对所述信号特征进行检测,以确定所述目标音频中是否包括语音,其中,所述第一模型为使用多组数据对初始模型进行机器学习训练后得到的模型,所述多组数据中的每组数据均包括:音频和用于标识音频中是否包括语音的标识信息,所述初始模型包括第一全连接层和第二全连接层。通过本发明,解决了相关技术中存在的对音频中是否存在语音检测不准确的问题,达到准确检测语音的效果。

技术领域

本发明实施例涉及通信领域,具体而言,涉及一种音频检测方法、装置、存储介质及电子装置。

背景技术

语音信号处理技术是当今人机交互领域的一项关键技术,例如,其中包括的语音端点检测就是从连续的语音流中检测出有效的语音段。它包括两个方面:检测出有效语音的起始点,即前端点;检测出有效语音的结束点,即后端点。在语音应用中进行语音的端点检测是很必要的。在存储或传输语音的场景下,从连续的语音流中分离出有效语音,可以降低存储或传输的数据量,简化人机交互。因此,语音端点检测是语音通信、语音识别、语音编码技术中前端处理的必要环节,对后续的语音处理性能表现起着至关重要的作用。

在相关技术中,语音端点检测方法主要采用的是开源工具WebRTC中的端点检测方法。其主要原理是将信号在频谱上进行子带划分为80Hz~250Hz,250Hz~500Hz,500Hz~1K,1K~2K,2K~3K,3K~4K六个频带,分别将计算得到的每个频带能量作为特征;通过假设检验,构建了噪声和语音两个假设,从而对每个子带构建由2个高斯分布组合的噪声和语音的混合高斯分布模型。通过极大似然估计对模型进行自适应学习优化,并通过概率比判决推断。由于常规的基于混合高斯模型的语音端点检测方法,采用混合高斯模型分别语音和噪声进行建模,对于每一帧输入的音频,分别计算语音的概率和噪声的概率,之后计算两种概率的似然比;结果与阈值进行比较,大于阈值判定为语音,小于阈值判定为静音。然而,由于混合高斯模型的建模能力有限,无法实现对语音的精确的建模,特别是复杂的语音环境下,基于混合高斯模型的语音端点检测性能严重下降。

由此可知,在相关技术中存在对音频中是否存在语音检测不准确的问题。

针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种音频检测方法、装置、存储介质及电子装置,以至少解决相关技术中存在的对音频中是否存在语音检测不准确的问题。

根据本发明的一个实施例,提供了一种音频检测方法,包括:获取目标音频的信号特征;使用第一模型对所述信号特征进行检测,以确定所述目标音频中是否包括语音,其中,所述第一模型为使用多组数据对初始模型进行机器学习训练后得到的模型,所述多组数据中的每组数据均包括:音频和用于标识音频中是否包括语音的标识信息,所述初始模型包括第一全连接层和第二全连接层。

根据本发明的另一个实施例,提供了一种音频检测装置,包括:获取模块,用于获取目标音频的信号特征;检测模块,用于使用第一模型对所述信号特征进行检测,以确定所述目标音频中是否包括语音,其中,所述第一模型为使用多组数据对初始模型进行机器学习训练后得到的模型,所述多组数据中的每组数据均包括:音频和用于标识音频中是否包括语音的标识信息,所述初始模型包括第一全连接层和第二全连接层。

根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述方法实施例中的步骤。

根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述方法实施例中的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海尔优家智能科技(北京)有限公司,未经海尔优家智能科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010617430.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top