[发明专利]基于卷积神经网络的语音增强方法、装置、设备及介质在审
| 申请号: | 202110605515.4 | 申请日: | 2021-05-31 |
| 公开(公告)号: | CN113345463A | 公开(公告)日: | 2021-09-03 |
| 发明(设计)人: | 张之勇;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L21/0224 | 分类号: | G10L21/0224;G10L21/0216;G10L21/0264;G10L25/30 |
| 代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 卷积 神经网络 语音 增强 方法 装置 设备 介质 | ||
本发明涉及人工智能技术领域,尤其涉及一种基于卷积神经网络的语音增强方法、装置、设备及介质。该基于卷积神经网络的语音增强方法包括获取待降噪语音的时域波形图以及语音增强模型;其中,语音增强模型包括依次连接的伽柏卷积层、简单递归层、特征掩蔽层以及反卷积层;通过复数滤波器对时域波形图进行伽柏变换,提取伽柏变换特征;将伽柏变换特征输入至简单递归层进行预测,以确定特征掩蔽层对应的掩蔽向量;通过特征掩蔽层,根据掩蔽向量对伽柏变换特征进行过滤,得到降噪后的伽柏变换特征;通过反卷积层对降噪后的伽柏变换特征进行还原,得到目标降噪语音。该基于卷积神经网络的语音增强方法可有效提高模型计算效率以及准确率。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于卷积神经网络的语音增强方法、装置、设备及介质。
背景技术
语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,加强有用语音信号的质量和清晰度,抑制、降低噪声干扰的技术。由于设计流程简单,端到端的神经网络模型在语音增强领域被广泛使用,但目前的大多研究没有有效考虑语音的局部和序列特性,导致目前的语音增强模型的计算效率以及准确率不高的问题。
发明内容
本发明实施例提供一种基于卷积神经网络的语音增强方法、装置、设备及介质,以解决目前语音增强模型的计算效率以及准确率不高的问题。
一种基于卷积神经网络的语音增强方法,包括:
获取待降噪语音的时域波形图;
将所述待降噪语音的时域波形图输入语音增强模型,其中,所述语音增强模型包括依次连接的伽柏卷积层、简单递归层、特征掩蔽层以及反卷积层;所述伽柏卷积层包括多个复数滤波器;
通过多个所述复数滤波器对时域波形图进行伽柏变换,提取所述待降噪语音的伽柏变换特征;
将所述伽柏变换特征输入至所述简单递归层进行预测,以确定所述特征掩蔽层对应的掩蔽向量;
通过特征掩蔽层,根据所述掩蔽向量对所述伽柏变换特征进行过滤,得到降噪后的伽柏变换特征;
通过所述反卷积层对所述降噪后的伽柏变换特征进行还原,得到目标降噪语音。
一种基于卷积神经网络的语音增强装置,包括:
数据获取模块,用于获取待降噪语音的时域波形图;
语音增强模块,用于将所述待降噪语音的时域波形图输入语音增强模型,其中,所述语音增强模型包括依次连接的伽柏卷积层、简单递归层、特征掩蔽层以及反卷积层;所述伽柏卷积层包括多个复数滤波器;
伽柏变换模块,用于通过多个所述复数滤波器对时域波形图进行伽柏变换,提取所述待降噪语音的伽柏变换特征;
预测模块,用于将所述伽柏变换特征输入至所述简单递归层进行预测,以确定所述特征掩蔽层对应的掩蔽向量;
过滤模块,用于通过特征掩蔽层,根据所述掩蔽向量对所述伽柏变换特征进行过滤,得到降噪后的伽柏变换特征;
还原模块,用于通过所述反卷积层对所述降噪后的伽柏变换特征进行还原,得到目标降噪语音。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于卷积神经网络的语音增强方法的步骤。
一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于卷积神经网络的语音增强方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110605515.4/2.html,转载请声明来源钻瓜专利网。





