[发明专利]一种语音降噪方法及装置在审
申请号: | 201910524862.7 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110136737A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 赵月峰;袁潮;温建伟 | 申请(专利权)人: | 北京拙河科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 李冬梅;苗源 |
地址: | 100083 北京市海淀区王庄路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音智能降噪方法及装置,涉及语音降噪技术。本发明公开的语音降噪方法,包括:将待降噪语音的二维时频信号输入至神经网络模型,得到该模型输出的二值掩蔽矩阵,利用该模型输出的二值掩蔽矩阵对待降噪语音的二维时频信号,进行掩蔽计算,得到降噪后的二维时频信号,将降噪后的二维时频信号进行反时频转换,得到降噪后的语音。其中,神经网络模型,是在输入模拟的含噪语音的二维时频信号至神经网络模型后,根据输出的二值掩蔽矩阵与理想的二值掩蔽矩阵之间的差值进行一次或多次训练得到的。本申请技术方案简化了降噪算法,在保证降噪质量的基础上,提高降噪效率。 | ||
搜索关键词: | 降噪 掩蔽 时频信号 语音 二维 矩阵 神经网络模型 输出 降噪技术 降噪算法 输入模拟 语音智能 时频 转换 申请 保证 | ||
【主权项】:
1.一种语音降噪方法,其特征在于,包括:将待降噪语音进行时频转换,得到待降噪语音的二维时频信号;将待降噪语音的二维时频信号输入至神经网络模型,得到所述神经网络模型输出的二值掩蔽矩阵,其中,所述神经网络模型,是在输入模拟的含噪语音的二维时频信号至神经网络模型后,根据输出的二值掩蔽矩阵与理想的二值掩蔽矩阵之间的差值进行一次或多次训练得到的;利用所述神经网络模型输出的二值掩蔽矩阵对待降噪语音的二维时频信号,进行掩蔽计算,得到降噪后的二维时频信号;将所述降噪后的二维时频信号进行反时频转换,得到降噪后的语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京拙河科技有限公司,未经北京拙河科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910524862.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种回音消除系统、方法、装置、设备及存储介质
- 下一篇:噪声估计方法及装置