[发明专利]基于深度学习的语音分离方法在审
申请号: | 201910337555.8 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110148419A | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 孙林慧;陶泽 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0264;G10L21/0308;G10L25/30 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明揭示了一种基于深度学习的语音分离方法,首先是将含有多个语音的信号划分为训练集信号和测试集信号,并将训练集信号与测试集信号分别进行预处理,之后进行傅里叶变换,得到训练集信号的幅度和相位、及测试集信号的幅度和相位,然后再将训练集信号的幅度和相位、及测试集信号的幅度和相位均进行归一化处理;接着将归一化处理后训练集信号的幅度和相位通过训练模型进行训练,且训练模型的算法采用深度神经网络的adam算法;最后将归一化处理后测试集信号通过训练模型预测,并完成语音分离;本发明将幅度与相位联合训练,在真实环境下语音分离效果更佳;另外,本发明采用深度神经网络的adam算法,使信噪比与语音的可懂度得到大幅度提高。 | ||
搜索关键词: | 测试集 训练集 语音 归一化处理 训练模型 算法 神经网络 预处理 傅里叶变换 分离效果 信号通过 真实环境 可懂度 信噪比 学习 预测 联合 | ||
【主权项】:
1.一种基于深度学习的语音分离方法,其特征在于,包括如下步骤:S1:将含有多个语音的信号划分为训练集信号和测试集信号,并将训练集信号与测试集信号分别进行预处理;然后将预处理后的训练集信号与预处理后的测试集信号分别进行傅里叶变换,得到训练集信号的幅度和相位、及测试集信号的幅度和相位;之后,分别将训练集信号的幅度和相位、及测试集信号的幅度和相位均进行归一化处理;S2:将步骤S1中归一化处理后训练集信号的幅度和相位通过训练模型进行训练,且训练模型的算法采用深度神经网络的adam算法;S3:将所述步骤S1中测试集信号的幅度和相位通过所述训练模型分别得到预测幅度值和预测相位值;接着,将所述预测幅度值和预测相位值通过傅里叶反变换得到预测信号进行输出,完成语音分离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910337555.8/,转载请声明来源钻瓜专利网。