[发明专利]音频降噪方法、装置、设备及介质有效
| 申请号: | 202011017669.3 | 申请日: | 2020-09-24 |
| 公开(公告)号: | CN112233688B | 公开(公告)日: | 2022-03-11 |
| 发明(设计)人: | 郝斌;冯大航;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
| 主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/03;G10L25/51 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢少真 |
| 地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 方法 装置 设备 介质 | ||
本公开提供了一种音频降噪方法、装置、设备及介质,属于音频处理技术领域。所述方法包括:根据待降噪音频帧中低频能量和高频能量的比例,确定所述待降噪音频帧的噪声存在概率;根据所述噪声存在概率,提取所述待降噪音频帧的噪声谱;根据所述噪声谱,去除所述待降噪音频帧中的噪声,得到目标音频帧。本公开实施例提供的技术方案,根据冲击噪声低高频分布的特点,确定噪声存在概率,从而提取噪声谱进行降噪步骤,无需很多帧音频信息来分析噪声衰减情况,从而对待降噪音频帧的降噪步骤的延迟较小,能够在较小延迟帧数下有效抑制冲击噪声,因而,降噪效果更好。
技术领域
本公开涉及音频处理技术领域,特别涉及一种音频降噪方法、装置、设备及介质。
背景技术
近年来,随着音频处理技术的不断发展,智能音箱、车载语音交互系统等智能语音交互系统不断普及,这些智能语音交互系统接收包括用户语音的音频,对音频进行处理,从而对音频中用户语音进行识别,实现人机交互。在实际使用中,智能语音交互系统接收到的音频中往往夹杂有不同种类的噪声,因此需要首先对这些音频进行降噪处理。
相关技术中,音频降噪方法通常是:利用冲击噪声快速衰减的特性,根据当前帧和未来几帧的音频信息,选取这几帧中最小的平滑功率谱作为需要追踪最小值的平滑功率谱。
在上述方法中,在延迟帧数设置较小时,有不少人声被估计成冲击噪声,从而造成语音损伤,因而,降噪效果差。
发明内容
本公开实施例提供了一种音频降噪方法、装置、设备及介质,提高了降噪效果。所述技术方案如下:
一方面,提供了一种音频降噪方法,所述方法包括:
根据待降噪音频帧中低频能量和高频能量的比例,确定所述待降噪音频帧的噪声存在概率;
根据所述噪声存在概率,提取所述待降噪音频帧的噪声谱;
根据所述噪声谱,去除所述待降噪音频帧中的噪声,得到目标音频帧。
在一种可能实现方式中,所述根据待降噪音频帧中低频能量和高频能量的比例,确定所述待降噪音频帧的噪声存在概率,包括:
响应于所述待降噪音频帧中低频能量和高频能量的比例大于比例阈值,将第一噪声存在概率确定为所述待降噪音频帧的噪声存在概率;
响应于所述待降噪音频帧中低频能量和高频能量的比例小于或等于比例阈值,将第二噪声存在概率确定为所述待降噪音频帧的噪声存在概率,所述第一噪声存在概率小于所述第二噪声存在概率。
在一种可能实现方式中,所述待降噪音频帧中低频能量和高频能量的比例的确定过程包括:
根据所述待降噪音频帧的频谱,获取所述待降噪音频帧中低频能量均值和高频能量均值;
将所述低频能量均值和高频能量均值的比值确定为所述待降噪音频帧中高频能量和低频能量的比例。
在一种可能实现方式中,所述根据所述噪声谱,去除所述待降噪音频帧中的噪声,得到目标音频帧,包括:
根据所述噪声谱中高频能量和低频能量的比例,对所述噪声谱进行调整;
根据调整后的噪声谱,去除所述待降噪音频帧中的噪声,得到目标音频帧。
在一种可能实现方式中,所述根据所述噪声谱中高频能量和低频能量的比例,对所述噪声谱进行调整,包括:
根据所述噪声谱中高频能量和低频能量的比例,确定所述噪声谱的语音存在概率;
根据所述语音存在概率,提取所述噪声谱中的噪声,得到调整后的噪声谱。
在一种可能实现方式中,所述根据所述噪声谱中高频能量和低频能量的比例,确定所述噪声谱的语音存在概率,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011017669.3/2.html,转载请声明来源钻瓜专利网。





