[发明专利]音频降噪方法、装置和电子设备有效
申请号: | 201910010479.X | 申请日: | 2019-01-04 |
公开(公告)号: | CN111477237B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 刘鲁鹏 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/02;G10L25/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 方法 装置 电子设备 | ||
1.一种音频降噪方法,包括:
获取包括音频帧序列的第一音频数据;
提取各音频帧的第一幅度谱;
依次处理各音频帧的第一幅度谱,得到降噪后的第二幅度谱;以及
基于各音频帧的所述第二幅度谱,结合音频帧的原始相位来构建降噪处理后的第二音频数据,
其中,所述处理各音频帧的第一幅度谱包括:将该音频帧的第一幅度谱以及在该音频帧之前的至少一个音频帧的第二幅度谱共同输入降噪模型,得到该音频帧的第二幅度谱。
2.根据权利要求1所述的方法,其中,所述将该音频帧的第一幅度谱以及在该音频帧之前的至少一个音频帧的第二幅度谱共同输入降噪模型,得到该音频帧的第二幅度谱包括:
确定所述音频帧之前且与所述音频帧相邻的预定数量的连续音频帧的第二幅度谱;
合并所述音频帧的第一幅度谱以及所述预定数量的音频帧的所述第二幅度谱,得到输入数据;
将所述输入数据输入降噪模型,得到所述音频帧的第二幅度谱。
3.根据权利要求1所述的方法,还包括:
从清洁音频数据中随机确定至少一个时间段;
将噪声数据按照随机确定的信噪比加入各个所述时间段,得到含噪声音频数据;以及
使用所述含噪声音频数据训练所述降噪模型。
4.根据权利要求1所述的方法,其中,所述降噪模型为神经网络,所述神经网络使用线性整流函数作为激活函数。
5.一种音频降噪装置,包括:
获取模块,用于获取包括音频帧序列的第一音频数据;
提取模块,用于提取各音频帧的第一幅度谱;
处理模块,用于依次处理各音频帧的第一幅度谱,得到降噪后的第二幅度谱;
构建模块,用于基于各音频帧的所述第二幅度谱,结合音频帧的原始相位来构建降噪处理后的第二音频数据,
其中,所述处理各音频帧的第一幅度谱包括:将该音频帧的第一幅度谱以及在该音频帧之前的至少一个音频帧的第二幅度谱共同输入降噪模型,得到该音频帧的第二幅度谱。
6.根据权利要求5所述的装置,其中,所述处理模块包括:
确定子模块,用于确定所述音频帧之前且与所述音频帧相邻的预定数量的连续音频帧的第二幅度谱;
合并子模块,用于合并所述音频帧的第一幅度谱以及所述预定数量的音频帧的所述第二幅度谱,得到输入数据;
处理子模块,用于将所述输入数据输入降噪模型,得到所述音频帧的第二幅度谱。
7.根据权利要求5所述的装置,还包括:
确定模块,用于从清洁音频数据中随机确定至少一个时间段;
制备模块,用于将噪声数据按照随机确定的信噪比加入各个所述时间段,得到含噪声音频数据;以及
训练模块,用于使用所述含噪声音频数据训练所述降噪模型。
8.根据权利要求5所述的装置,其中,所述降噪模型为神经网络,所述神经网络使用线性整流函数作为激活函数。
9.一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序,
其中,当一个或多个计算机程序被一个或多个处理器执行时,使得一个或多个处理器实现权利要求1至4中任一项的方法。
10.一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至4中任一项的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910010479.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于UV打印的圆点光栅材料
- 下一篇:晾衣机