[发明专利]一种降噪模型的训练方法、降噪方法、装置和存储介质在审
申请号: | 202111130725.9 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113903349A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 赵湘;付中华;王海坤 | 申请(专利权)人: | 西安讯飞超脑信息科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L25/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 710000 陕西省西安市高新区西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 存储 介质 | ||
1.一种降噪方法,包括:
获取带噪语音数据,将所述带噪语音数据输入到降噪模型中,得到降噪后的语音数据;
其中,所述降噪模型包括编码器与第一解码器,所述降噪模型的训练方法包括:
获取多个训练样本,所述训练样本包括样本带噪数据以及与所述样本带噪数据对应的第一样本干净语音数据与第一样本干净文本数据;
基于所述编码器对所述样本带噪语音数据进行处理,得到第一样本特征数据;
将所述第一样本特征数据输入所述第一解码器,得到估计语音数据;
将所述第一样本特征数据输入第二解码器,得到估计文本数据;
基于所述估计语音数据与所述第一样本干净语音数据之间的损失以及所述估计文本数据与所述第一样本干净文本数据之间的损失,对所述降噪模型的模型参数进行调整,直至满足预设训练结束条件,得到训练完的降噪模型。
2.根据权利要求1所述的降噪方法,其特征在于,所述第一样本干净文本数据与所述估计文本数据均包括字典ID,所述方法还包括:
基于所述第一样本干净文本数据中的字典ID与所述估计文本数据中的字典ID之间的差异度以及所述第一样本干净语音数据与所述估计语音数据之间的差异度,计算当前损失值;
基于所述当前损失值,判断是否满足所述预设训练结束条件;
若否,则调整所述模型参数,继续进行训练。
3.根据权利要求2所述的降噪方法,其特征在于,所述第一样本干净文本数据包括多帧干净文本信号,所述估计文本数据包括多帧估计文本信号,所述第一样本干净语音数据包括多帧干净语音信号,所述估计语音数据包括多帧估计语音信号,所述方法还包括:
计算每帧所述干净文本信号的字典ID与所述估计文本信号的字典ID之间的差异度,得到第一损失值;
计算每帧所述干净语音信号与所述估计语音信号之间的差异度,得到第二损失值;
对所述第一损失值与所述第二损失值进行加权求和,得到损失值;
对所有所述损失值进行平均,得到所述当前损失值。
4.根据权利要求2所述的降噪方法,其特征在于,所述第一样本特征数据包括多帧第一样本子特征,所述将所述第一样本特征数据输入所述第一解码器,得到估计语音数据的步骤之前,包括:
获取第二样本特征数据,所述第二样本特征数据包括多帧第二样本子特征;
利用自注意力层对当前帧第一样本子特征与上一帧第二样本子特征进行处理,生成当前帧状态特征,并将所述当前帧状态特征输入所述第二解码器。
5.根据权利要求2所述的降噪方法,其特征在于,所述获取多个训练样本的步骤,包括:
获取第一样本噪声数据与所述第一样本干净语音数据;
对所述第一样本噪声数据与所述第一样本干净语音数据进行叠加处理,得到所述带噪语音数据。
6.根据权利要求5所述的降噪方法,其特征在于,所述方法还包括:
获取第二样本噪声数据与第二样本干净语音数据;
分别对所述第二样本噪声数据与第二样本干净语音数据进行预处理,得到所述第一样本噪声数据与所述第一样本干净语音数据;
对所述第二样本干净语音数据进行转写处理,生成第二样本干净字符数据;
将所述第二样本干净字符数据中的标点符号删除,并将所述第二样本干净字符数据中每个字符的语言类型转换为预设语言类型,得到第一样本干净字符数据;
对所有所述第一样本干净字符数据进行去重处理,得到第三样本干净字符数据;
为所述第三样本干净字符数据中的每个字符分配字典ID,以构建文本字典,所述文本字典包括所述第三样本干净字符数据中的每个字符以及与所述字符对应的字典ID;
基于所述文本字典,为所述第一样本干净字符数据分配字典ID,得到所述第一样本干净文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安讯飞超脑信息科技有限公司,未经西安讯飞超脑信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130725.9/1.html,转载请声明来源钻瓜专利网。