[发明专利]一种基于加权语音损失的语音增强神经网络训练方法及装置有效
申请号: | 202111483345.3 | 申请日: | 2021-12-07 |
公开(公告)号: | CN113921030B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 苏家雨;王博;欧阳鹏 | 申请(专利权)人: | 江苏清微智能科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30;G06N3/08 |
代理公司: | 北京索睿邦知识产权代理有限公司 11679 | 代理人: | 李根 |
地址: | 211100 江苏省南京市江宁区麒麟*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 加权 语音 损失 增强 神经网络 训练 方法 装置 | ||
1.一种基于加权语音损失的语音增强神经网络训练方法,其特征在于,所述方法包括:
提取训练样本中带噪语音的对数功率谱特征,所述训练样本中包括所述带噪语音以及用于构成所述带噪语音的干净语音和噪声;
将所提取的对数功率谱特征输入初始语音增强神经网络得到所述带噪语音的预估增益;
基于所述预估增益和噪声,计算表征所述带噪语音噪声抑制效果的第一损失值;
基于所述预估增益和目标语音帧,计算表征所述带噪语音失真情况的第二损失值,所述目标语音帧为所述干净语音和噪声中存在语音活动的帧;
获取所述第一损失值和第二损失值的权值,并基于所获取的权值进行加权计算得到最终损失值;
在所述最终损失值不收敛的情况下,基于所述最终损失值调整所述初始语音增强神经网络,并返回将所提取的对数功率谱特征输入初始语音增强神经网络得到所述带噪语音的预估增益的步骤;
在所述最终损失值收敛的情况下,将所述初始语音增强神经网络作为用于语音增强的神经网络。
2.如权利要求1所述的方法,其特征在于,基于所述预估增益和噪声,计算表征所述带噪语音噪声抑制效果的第一损失值的步骤,包括:
基于所述预估增益和噪声,通过以下表达式计算表征所述带噪语音噪声抑制效果的第一损失值:
其中,表示所述第一损失值,G表示所述预估增益,N表示所述噪声,mean表示均方误差运算函数。
3.如权利要求1所述的方法,其特征在于,基于所述预估增益和目标语音帧,计算表征所述带噪语音失真情况的第二损失值的步骤,包括:
基于所述预估增益和目标语音帧,通过以下表达式计算表征所述带噪语音失真情况的第二损失值:
其中,表示所述第二损失值,G表示所述预估增益,N表示所述噪声,S表示所述干净语音,下标A表示存在语音活动的帧,mean表示均方误差运算函数。
4.如权利要求1所述的方法,其特征在于,确定所述目标语音帧的步骤,包括:
基于当前帧在目标频段的频域表示,计算所述当前帧的能量和;
在计算得到的能量和大于预定阈值的情况下记为0,小于预定阈值的情况下记为1,平滑所述当前帧以及所述当前帧之前预定数量帧的能量和与预定阈值的比较结果,并根据平滑处理后的比较结果确定当前帧是否为目标语音帧。
5.如权利要求1所述的方法,其特征在于,获取所述第一损失值和第二损失值的权值的步骤,包括:
基于信噪比通过以下表达式计算所述第二损失值的权值:
其中,SNR表示信噪比,β为一个设定的常数;
基于所述第一损失值的权值与所述第二损失值的权值之和为1的运算规则,确定所述第一损失值的权值。
6.一种基于加权语音损失的语音增强神经网络训练装置,其特征在于,所述装置包括:
特征提取模块,用于提取训练样本中带噪语音的对数功率谱特征,所述训练样本中包括所述带噪语音以及用于构成所述带噪语音的干净语音和噪声;
语音增强神经网络模块,用于将所提取的对数功率谱特征输入初始语音增强神经网络得到所述带噪语音的预估增益;
损失值计算模块,用于基于所述预估增益和噪声,计算表征所述带噪语音噪声抑制效果的第一损失值;基于所述预估增益和目标语音帧,计算表征所述带噪语音失真情况的第二损失值,所述目标语音帧为所述干净语音和噪声中存在语音活动的帧;获取所述第一损失值和第二损失值的权值,并基于所获取的权值进行加权计算得到最终损失值;
神经网络调整模块,用于在所述最终损失值不收敛的情况下,基于所述最终损失值调整所述初始语音增强神经网络,并返回将所提取的对数功率谱特征输入初始语音增强神经网络得到所述带噪语音的预估增益的步骤;在所述最终损失值收敛的情况下,将所述初始语音增强神经网络作为用于语音增强的神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏清微智能科技有限公司,未经江苏清微智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111483345.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可降解防震气泡膜及其制备方法
- 下一篇:一种器件结构及其制备方法