[发明专利]一种基于GRU神经网络的去除噪声方法及系统有效
| 申请号: | 202010242904.0 | 申请日: | 2020-03-31 |
| 公开(公告)号: | CN111477239B | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 曾志先;肖龙源;李稀敏;叶志坚;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/16;G10L15/06;G06N3/08;G06N3/0464 |
| 代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 吴圳添 |
| 地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 gru 神经网络 去除 噪声 方法 系统 | ||
1.一种基于GRU神经网络的去除噪声方法,其特征在于,所述方法包括:
步骤一,搭建GRU神经网络模型,所述GRU网络模型包括三层GRU网络层和全连接网络层;
步骤二,训练GRU神经网络模型;
步骤三,将带有加噪的音频文件通过Python的Librosa库转为频谱图数据;
步骤四,将频谱图数据传输到训练好的GRU神经网络当中,输出去除加噪之后的音频频谱图数据,
所述频谱图数据将会是二维的矩阵结构,矩阵结构的第一个维度为音频的帧数,第二个维度为频谱图的特征维度;
步骤五,通过开源的vocoder解码网络将去除加噪之后的音频频谱图数据转为音频数据;
步骤六,将音频数据保存为音频文件形式;
所述训练GRU神经网络模型步骤包括:
将加噪音频的频谱图特征数据输入到GRU神经网络模型中,得到预测的干净音频频谱图;
将预测的干净音频频谱图与加噪音频对应的原始干净音频频谱图进行损失值计算;
进行迭代训练,得到训练好的GRU神经网络模型。
2.根据权利要求1所述的基于GRU神经网络的去除噪声方法,其特征在于,步骤二训练GRU神经网络模型前还包括,
收集第一数量的干净无噪声音频;
将第二数量的噪声音频分别添加至无噪声音频中制作出加噪音频,所述噪声音频包含办公室环境噪声、食堂环境噪声、学校环境噪声、室外环境噪声中的至少一种。
3.根据权利要求2所述的基于GRU神经网络的去除噪声方法,其特征在于,
将噪声音频添加至无噪声音频中的添加方式为无噪声音频与噪声音频点对点求和。
4.根据权利要求2所述的基于GRU神经网络的去除噪声方法,其特征在于,
采用AiShell音频作为干净无噪声音频。
5.根据权利要求1所述的基于GRU神经网络的去除噪声方法,其特征在于,
通过TensorFlow中的AdamOptimizer进行损失值的迭代训练。
6.根据权利要求1所述的基于GRU神经网络的去除噪声方法,其特征在于,
通过欧式距离的方式来计算损失值。
7.根据权利要求1所述的基于GRU神经网络的去除噪声方法,其特征在于,
将所述加噪音频的频谱图特征数据将作为GRU神经网络网络的输入数据,无噪声音频的频谱图数据将作为GRU神经网络网络的标签数据。
8.一种服务器,其特征在于,所述服务器包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1至7任意一项所述基于GRU神经网络的去除噪声方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述基于GRU神经网络的去除噪声方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010242904.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种密性透气两用工装
- 下一篇:一种乳头内陷治疗装置及文胸





