[发明专利]一种音频信号筛选方法、装置、设备及存储介质有效
申请号: | 202011549999.7 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112750453B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 刘鲁鹏;元海明;李贝;王晓红;陈佳路;高强;夏龙;郭常圳 | 申请(专利权)人: | 北京猿力未来科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L25/51 |
代理公司: | 北京汇鑫君达知识产权代理有限公司 11769 | 代理人: | 李辰 |
地址: | 100102 北京市朝阳区广顺南大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 筛选 方法 装置 设备 存储 介质 | ||
本申请是关于一种音频信号筛选方法、装置、设备及存储介质。该方法包括:确定每帧音频信号的信号能量和确定音频信号中每帧音频信号的信噪比;根据所述每帧音频信号的信噪比和所述每帧音频信号的信号能量,确定不同统计条件下的两种帧数,并确定所述两种帧数的比值;根据所述比值大于设定比值阈值,确定所述音频信号为目标音频信号。本申请提供的方案,能够简单有效地实现筛选出背景噪声小的目标音频信号筛选出背景噪声小的目标音频信号,具有更好的通用性。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种音频信号筛选方法、装置、设备及存储介质。
背景技术
在语音识别的人工智能领域,需要大量的音频信号样本进行机器学习,音频信号样本的质量会直接影响到机器学习过程中训练模型的准确程度。而日常生活中收集到的音频信号会存在有大量噪声,不利于语音类别的模型训练,因此需要在众多音频信号中筛选出噪声较小的音频信号。相关技术中的音频筛选方法,通过将待筛选的音频的特征和目标音频(满足噪声要求的音频)的特征进行对比,若对比结果满足预设条件,则将待筛选音频作为可用音频或作为训练样本。
但是,相关技术所实施的方案,在进行特征对比之前,需要对每个音频信号进行特征提取,音频特征提取不易,可能因为音频特征提取有误,导致筛选的准确性不高;另外根据不同类别或功能的训练需求,音频特征提取需要设定相应的特征提取模型,特征提取模型的通用性不高,实现的复杂度较大。
发明内容
为克服相关技术中存在的问题,本申请提供一种音频信号筛选方法、装置、设备及存储介质,该音频信号筛选方法能够简单有效地实现筛选出背景噪声小的目标音频信号,具有更好的通用性。
本申请第一方面提供一种音频信号筛选方法,包括:
确定每帧音频信号的信号能量和确定音频信号中每帧音频信号的信噪比;
根据所述每帧音频信号的信噪比和所述每帧音频信号的信号能量,确定不同统计条件下的两种帧数,并确定所述两种帧数的比值;
根据所述比值大于设定比值阈值,确定所述音频信号为目标音频信号;
所述根据所述每帧音频信号的信噪比和所述每帧音频信号的信号能量,确定不同统计条件下的两种帧数,并确定所述两种帧数的比值,包括:
统计所述每帧音频信号的信噪比大于设定信噪比阈值,且所述每帧音频信号的信号能量大于信号能量阈值的第一帧数;将每帧音频信号的信号能量分别与设定值进行差值运算得到各个值后,通过max函数得到各个值中的最大值作为信号能量阈值;
统计所述每帧音频信号的信号能量大于信号能量阈值的第二帧数;
确定所述第一帧数与所述第二帧数的比值。在一种方式中,所述统计所述每帧音频信号的信噪比大于设定信噪比阈值,且所述每帧音频信号的信号能量大于信号能量阈值的第一帧数,包括:
遍历所述每帧音频信号的信噪比和所述每帧音频信号的信号能量,统计所述每帧音频信号的信噪比大于设定信噪比阈值,且所述每帧音频信号的信号能量大于信号能量阈值的第一帧数;
所述统计所述每帧音频信号的信号能量大于信号能量阈值的第二帧数,包括:
遍历所述每帧音频信号的信号能量,统计所述每帧音频信号的信号能量大于信号能量阈值的第二帧数。
在一种方式中,所述确定音频信号中每帧音频信号的信噪比,包括:
将所述音频信号进行分帧;
将每帧音频信号进行降噪处理,得到降噪后的每帧音频信号;
根据降噪后的每帧音频信号的信号能量与降噪前的每帧音频信号的噪声能量,确定所述降噪前的每帧音频信号的信噪比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011549999.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种天线系统及耳机
- 下一篇:一种应用于客户数据的额度训练模型