[发明专利]音频降噪方法、系统、设备及存储介质在审
申请号: | 202010548206.3 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111798862A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 陈英博 | 申请(专利权)人: | 普联技术有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0272 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 黄诗彬;郝传鑫 |
地址: | 518000 广东省深圳市南山区深南路科技*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 系统 设备 存储 介质 | ||
本发明公开了一种音频降噪方法,包括:对音频进行分帧,并计算当前帧的能量;判断所述当前帧的能量与预设的混合高斯模型中的若干个单高斯模型是否匹配;根据匹配结果确定所述当前帧的类型;其中,所述当前帧的类型包括激活帧和背景帧;当所述当前帧为激活帧时,获取与所述激活帧的频域数组匹配的单高斯模型的第一目标标准差;根据所述第一目标标准差利用预设的降噪算法对所述激活帧进行降噪。本发明还公开一种音频降噪系统、一种音频降噪设备和一种计算机可读存储介质。采用本发明实施例,能有效提高音频的降噪效果。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种音频降噪方法、系统、设备及存储介质。
背景技术
降噪是音频或语音优化中一个重要的功能,通过麦克风采集到的声音,除了有用信号外,往往掺杂着很多噪声。噪声的来源有很多,有环境中的杂音,也有音频采集设备自身产生的噪声,如电流声,电路元器件产生的噪声等等。过大的噪声会影响用户体验,所以需要降噪算法来对噪声进行抑制。近年来,随着深度学习的发展,有很多利用深度学习的语音降噪技术问世,如WaveNet与rnnoise。但深度学习需要的算力太高,而且降噪效果与训练数据强相关,泛化性较差,很有可能换了一个环境后,降噪效果会大打折扣。
发明内容
本发明实施例的目的是提供一种音频降噪方法、系统、设备及存储介质,能有效提高音频的降噪效果。
为实现上述目的,本发明实施例提供了一种音频降噪方法,包括:
对音频进行分帧,并计算当前帧的能量;
判断所述当前帧的能量与预设的混合高斯模型中的若干个单高斯模型是否匹配;
根据匹配结果确定所述当前帧的类型;其中,所述当前帧的类型包括激活帧和背景帧;
当所述当前帧为激活帧时,获取与所述激活帧的频域数组匹配的单高斯模型的第一目标标准差;
根据所述第一目标标准差利用预设的降噪算法对所述激活帧进行降噪。
作为上述方案的改进,所述对音频进行分帧,并计算当前帧的能量,包括:
对音频进行分帧;其中,每一帧中包含若干个时域点;
根据每一所述时域点的幅值计算当前帧的能量。
作为上述方案的改进,所述方法还包括:
当所述当前帧为背景帧时,将所述背景帧中每个所述时域点的幅值输入所述混合高斯模型中,以更新所述混合高斯模型的参数;
获取与所述背景帧的频域数组匹配的更新参数后的所述混合高斯模型中单高斯模型的第二目标标准差;
根据所述第二目标标准差利用预设的降噪算法对所述背景帧进行降噪。
作为上述方案的改进,所述判断所述当前帧的能量与预设的混合高斯模型中的若干个单高斯模型是否匹配,具体包括:
将所述当前帧的能量按照预设匹配顺序与若干个单高斯模型依次进行匹配;
判断所述当前帧的能量与当前单高斯模型的均值的差值是否小于或等于所述当前单高斯模型的标准差与预设第一阈值的乘积;
若是,则判定所述当前帧的能量与所述当前单高斯模型匹配成功;若否,则判定所述当前帧的能量与所述当前单高斯模型匹配失败。
作为上述方案的改进,所述根据匹配结果确定所述当前帧的类型,包括:
当所述当前帧的能量与任一单高斯模型匹配成功时,更新当前单高斯模型的参数;
对所述混合高斯模型中的所有单高斯模型的权重进行调整,以使所有单高斯模型的权重的和为预设固定值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于普联技术有限公司,未经普联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010548206.3/2.html,转载请声明来源钻瓜专利网。