[发明专利]一种语音降噪方法及装置在审
申请号: | 201910524862.7 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110136737A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 赵月峰;袁潮;温建伟 | 申请(专利权)人: | 北京拙河科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 李冬梅;苗源 |
地址: | 100083 北京市海淀区王庄路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 降噪 掩蔽 时频信号 语音 二维 矩阵 神经网络模型 输出 降噪技术 降噪算法 输入模拟 语音智能 时频 转换 申请 保证 | ||
1.一种语音降噪方法,其特征在于,包括:
将待降噪语音进行时频转换,得到待降噪语音的二维时频信号;
将待降噪语音的二维时频信号输入至神经网络模型,得到所述神经网络模型输出的二值掩蔽矩阵,其中,所述神经网络模型,是在输入模拟的含噪语音的二维时频信号至神经网络模型后,根据输出的二值掩蔽矩阵与理想的二值掩蔽矩阵之间的差值进行一次或多次训练得到的;
利用所述神经网络模型输出的二值掩蔽矩阵对待降噪语音的二维时频信号,进行掩蔽计算,得到降噪后的二维时频信号;
将所述降噪后的二维时频信号进行反时频转换,得到降噪后的语音。
2.根据权利要求1所述的语音降噪方法,其特征在于,该方法还包括:
创建用于输出二值掩蔽矩阵的神经网络模型,对所述神经网络模型进行训练,训练过程包括:
输入模拟的含噪语音的二维时频信号至所述神经网络模型;
所述神经网络模型针对输入的二维时频信号,提取时频域上的特征点并进行分类,得到语音特征点和噪音特征点,根据所述语音特征点和噪音特征点确定二值掩蔽矩阵并输出;
将所述神经网络模型输出的二值掩蔽矩阵与理想的二值掩蔽矩阵进行比较,若比较结果不满足设定要求,则对所述神经网络模型的参数进行一次或多次的修正,直到最近一次修正后的神经网络模型输出的二值掩蔽矩阵与理想的二值掩蔽矩阵的比较结果满足设定要求,将最近一次修正的神经网络模型做为所述语音降噪方法中用于输出二值掩蔽矩阵的神经网络模型。
3.根据权利要求2所述的语音降噪方法,其特征在于,所述神经网络模型针对输入的二维时频信号,提取时频域上的特征点并进行分类,包括:
在神经网络模型中,利用卷积神经网络提取输入的二维时频信号在时频域上的特征点,使用非线性激活函数对提取的每一个时频域的特征点进行分类,分类得到语音特征点和噪音特征点。
4.根据权利要求3所述的语音降噪方法,其特征在于,
所述将所述神经网络模型输出的二值掩蔽矩阵与理想的二值掩蔽矩阵进行比较,若比较结果不满足设定要求,则对所述神经网络模型的参数进行一次或多次的修正,包括:
计算所述神经网络模型输出的二值掩蔽矩阵与理想的二值掩蔽矩阵的方差,计算得到的方差大于设定阈值时,确定不满足设定要求,此时,根据计算得到的方差,修正所述神经网络模型中卷积神经网络层参数。
5.根据权利要求1至4任一项所述的语音降噪方法,其特征在于,该方法还包括:
计算理想的二值掩蔽矩阵,该过程包括:
根据模拟的含噪语音的二维时频信号,以及模拟的含噪语音对应的纯净语音的二维时频信号,计算二维时频信号的信噪比SNR(t,f);
将所述信噪比SNR(t,f)与设定信噪比阈值LC进行比较,根据比较结果得到理想的二值掩蔽矩阵IBM(t,f)。
6.根据权利要求5所述的语音降噪方法,其特征在于,所述将所述信噪比SNR(t,f)与设定信噪比阈值LC进行比较,根据比较结果得到理想的二值掩蔽矩阵IBM(t,f)的方式如下:
7.根据权利要求5所述的语音降噪方法,其特征在于,
所述将待降噪语音进行时频转换,得到待降噪语音的二维时频信号,包括:
对待降噪语音进行分帧、归一化处理,将分帧处理后的每一帧数据进行短时傅立叶变换,得到待降噪语音的二维时频信号;
所述将所述降噪后的二维时频信号进行反时频转换,得到降噪后的语音,包括:
对降噪后的二维时频信号进行反向短时傅立叶变换,得到降噪后的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京拙河科技有限公司,未经北京拙河科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910524862.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种回音消除系统、方法、装置、设备及存储介质
- 下一篇:噪声估计方法及装置