[发明专利]模型训练方法、装置、电子设备及存储介质在审
申请号: | 202010575643.4 | 申请日: | 2020-06-22 |
公开(公告)号: | CN111883164A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 张旭;郑羲光;张晨 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L25/30;G06N3/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李娜 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 存储 介质 | ||
本公开关于一种模型训练方法、装置、电子设备及存储介质,训练方法包括获取多个样本数据,根据样本数据中的原始音频数据和带噪音频数据,确定每个样本数据中的带噪音频数据在各个采样点的第一特征信息和幅度特征信息。调整第一特征信息以得到目标特征信息,根据目标特征信息和对应的幅度特征信息对待训练模型进行训练,获得训练好的模型。在通过训练好的模型对音频数据进行去噪时,在较低的信噪比范围时可以增强模型的去噪强度,在较高的信噪比范围时可以降低模型的去噪强度,可以使训练好的模型针对不同信噪比范围内的音频数据,获得不同的去噪效果。
技术领域
本公开涉及计算机技术领域,尤其涉及一种模型训练方法、装置、电子设备及存储介质。
背景技术
随着计算机技术的发展,神经网络越来越多的被运用到音频数据的处理中,相比于传统算法,神经网络往往能获得更好的效果和性能。在音频数据的去噪过程中,首先对待训练模型进行训练,得到训练好的模型,然后通过训练好的模型对音频数据进行去噪,得到去除噪声数据后的音频数据。
在待训练模型的训练过程中,样本数据是随机的,样本数据可以是信噪较低的音频数据或信噪比较高的音频数据,由随机样本数据训练得到的模型,无法针对不同信噪比范围的音频数据,采用不同的去噪强度进行去噪。
发明内容
本公开提供一种模型训练方法、装置、电子设备及存储介质,以至少解决在音频数据的去噪过程中,模型无法针对不同信噪比范围的音频数据,采用不同的去噪强度进行去噪的问题。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种模型训练方法,包括:
获取多个样本数据,每个所述样本数据包括原始音频数据和带噪音频数据;
根据所述原始音频数据和带噪音频数据,确定每个样本数据中的带噪音频数据在各个采样点的第一特征信息和幅度特征信息,所述第一特征信息用于表示所述带噪音频数据在相应采样点的信噪比信息;
调整所述第一特征信息以得到目标特征信息;其中,当所述第一特征信息小于等于第一阈值时,减小所述第一特征信息,当所述第一特征信息大于等于第二阈值时,增大所述第一特征信息,所述第一阈值小于所述第二阈值;
将所述幅度特征信息输入待训练模型中,得到所述待训练模型输出的第二特征信息;
根据所述第二特征信息和所述目标特征信息,获取所述待训练模型的损失值;
根据所述损失值调整所述待训练模型的模型参数,直至损失值小于等于预设阈值时,将所述待训练模型作为训练好的模型。
可选的,所述调整所述第一特征信息以得到目标特征信息,包括:
当所述第一特征信息小于等于所述第一阈值时,将所述第一特征信息减小到第三阈值以下;
当所述第一特征信息大于等于所述第二阈值时,将所述第一特征信息增大到第四阈值以上。
可选的,还包括:当所述第一特征信息大于所述第一阈值、且小于所述第二阈值时,将所述第一特征信息调整到第五阈值至第六阈值之间,所述第五阈值小于所述第六阈值。
可选的,所述调整所述第一特征信息以得到目标特征信息,包括:通过映射函数对所述第一特征信息进行调整,以得到所述目标特征信息。
可选的,所述第一特征信息为所述采样点对应的所述原始音频数据的幅度值与所述带噪音频数据的幅度值之间的比值,所述第一特征信息小于等于1。
可选的,所述根据所述原始音频数据和带噪音频数据,确定每个样本数据中的带噪音频数据在各个采样点的第一特征信息和幅度特征信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010575643.4/2.html,转载请声明来源钻瓜专利网。