[发明专利]基于幅度谱的语音降噪方法、装置、设备及存储介质有效
申请号: | 202210223124.0 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114333882B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 李杰;王广新;杨汉丹 | 申请(专利权)人: | 深圳市友杰智新科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L25/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;陈秋波 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 幅度 语音 方法 装置 设备 存储 介质 | ||
本申请揭示了一种基于幅度谱的语音降噪方法、装置、设备及存储介质,其中方法包括:获取目标语音对应的待降噪频谱图;采用预设的降噪模型,对所述待降噪频谱图进行降噪处理,得到已降噪频谱图,其中,所述降噪模型依次包括:幅度谱降噪单元、频谱修正单元和掩码增益与减益单元,所述幅度谱降噪单元用于进行幅度谱降噪,所述频谱修正单元用于进行频谱修正;对所述已降噪频谱图进行语音信号重建,得到所述目标语音对应的目标干净语音。通过幅度谱降噪单元在幅度谱进行降噪处理,通过频谱修正单元频谱修正,从而使语音的有人说话部分和无人说话部分均有较好的降噪效果。
技术领域
本申请涉及到人工智能技术领域,特别是涉及到一种基于幅度谱的语音降噪方法、装置、设备及存储介质。
背景技术
语音中通常包含噪声,当包含噪声的语音应用到实际场景时,降低了语音应用的准确性,影响了用户体验。现有采用基于CNN(卷积神经网络)和RNN(循环神经网络)得到的降噪模型对语音进行降噪,虽然取得了不错的降噪效果,但是在语音的无人说话部分的降噪效果较差。
发明内容
本申请的主要目的为提供一种基于幅度谱的语音降噪方法、装置、设备及存储介质,旨在解决现有采用基于CNN和RNN(循环神经网络)得到的降噪模型对语音进行降噪,在语音的无人说话部分的降噪效果较差的技术问题。
为了实现上述发明目的,本申请提出一种基于幅度谱的语音降噪方法,所述方法包括:
获取目标语音对应的待降噪频谱图;
采用预设的降噪模型,对所述待降噪频谱图进行降噪处理,得到已降噪频谱图,其中,所述降噪模型依次包括:幅度谱降噪单元、频谱修正单元和掩码增益与减益单元,所述幅度谱降噪单元用于进行幅度谱降噪,所述频谱修正单元用于进行频谱修正;
对所述已降噪频谱图进行语音信号重建,得到所述目标语音对应的目标干净语音。
进一步的,所述采用预设的降噪模型,对所述待降噪频谱图进行降噪处理,得到已降噪频谱图的步骤,包括:
将所述待降噪频谱图输入所述幅度谱降噪单元进行幅度谱降噪,得到增强幅度谱;
从所述待降噪频谱图中提取带噪相位谱;
将所述增强幅度谱和所述带噪相位谱输入所述频谱修正单元进行频谱修正,得到频谱修正数据;
对所述频谱修正数据和所述增强幅度谱进行残差连接,得到待分析频谱图;
将所述待分析频谱图输入所述掩码增益与减益单元进行掩码,得到所述已降噪频谱图。
进一步的,所述将所述待降噪频谱图输入所述幅度谱降噪单元进行幅度谱降噪,得到增强幅度谱的步骤,包括:
从所述待降噪频谱图中提取带噪幅度谱;
采用所述幅度谱降噪单元的降维层,对所述带噪幅度谱进行降维,得到已降维幅度谱;
采用所述幅度谱降噪单元的幅度谱降噪层集,对所述已降维幅度谱进行幅度谱降噪,得到待升维特征,其中,所述幅度谱降噪层集中包括至少一个幅度谱降噪层,所述幅度谱降噪层采用LSTM网络;
采用所述幅度谱降噪单元的升维层,对所述待升维特征进行升维,得到幅度掩码值;
根据所述幅度掩码值和所述带噪幅度谱,确定所述增强幅度谱。
进一步的,所述将所述增强幅度谱和所述带噪相位谱输入所述频谱修正单元进行频谱修正,得到频谱修正数据的步骤,包括:
根据所述增强幅度谱和所述带噪相位谱生成增强频谱图;
将所述增强频谱图输入所述频谱修正单元的编码器进行特征提取,得到多个单层编码特征和目标编码特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市友杰智新科技有限公司,未经深圳市友杰智新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210223124.0/2.html,转载请声明来源钻瓜专利网。