[发明专利]语音降噪模型的训练方法、语音评分方法、装置及介质在审
申请号: | 202111025632.X | 申请日: | 2021-09-02 |
公开(公告)号: | CN114283828A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 柯登峰;解焱陆;张劲松;林炳怀;王丽园 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0264;G10L25/60 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王花丽;张颖玲 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 模型 训练 方法 评分 装置 介质 | ||
本申请提供了一种语音降噪模型的训练方法、装置、电子设备及存储介质;语音降噪模型包括:噪音处理层,发音差异处理层和内容差异处理层,方法包括:通过噪音处理层,对语音样本进行降噪处理,得到目标语音样本;通过发音差异处理层,对目标语音样本进行发音评分的预测,得到发音预测结果,该发音预测结果,用于指示目标语音样本与语音样本对应的参考发音间的发音相似度;通过内容差异处理层,确定目标语音样本的内容与语音样本的内容间的内容差异;基于发音预测结果以及内容差异,更新语音降噪模型的模型参数,以得到训练完成的语音降噪模型;通过本申请,能够提高语音降噪模型的降噪精确程度。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种语音降噪模型的训练方法、语音评分方法、装置、电子设备及存储介质。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能已经越来越多地应用于语音处理方面。相关技术中,语音降噪模型的学习目标通常是使得降噪后语音的波形和纯净语音的波形最相似,而以波形最接近为目标学习时,通常只能关注到波形幅度大的语音,而幅度小的语音则直接被忽略掉,导致降噪处理过程中丢失部分语音信息,降噪准确度低。
发明内容
本申请实施例提供一种语音降噪模型的训练方法、装置、电子设备及存储介质,能够提高语音降噪模型的降噪精确程度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种语音降噪模型的训练方法,所述语音降噪模型包括:噪音处理层,发音差异处理层和内容差异处理层,方法包括:
通过所述噪音处理层,对语音样本进行降噪处理,得到目标语音样本;
通过所述发音差异处理层,对所述目标语音样本进行发音评分的预测,得到发音预测结果,所述发音预测结果,用于指示所述目标语音样本与所述语音样本对应的参考发音间的发音相似度;
通过所述内容差异处理层,确定所述目标语音样本的内容与所述语音样本的内容间的内容差异;
基于所述发音预测结果以及所述内容差异,更新所述语音降噪模型的模型参数,以得到训练完成的语音降噪模型。
上述方案中,所述发音差异处理层包括:发音评分损失处理层;
所述基于所述发音预测结果以及所述内容差异,更新所述语音降噪模型的模型参数,包括:
通过所述发音评分损失处理层,确定所述发音预测结果、与所述语音样本对应的样本标签之间的差异,并基于所述差异确定评分损失函数的值;
基于所述内容差异以及所述评分损失函数的值,更新所述语音降噪模型的模型参数。
上述方案中,所述基于所述内容差异以及所述评分损失函数的值,更新所述语音降噪模型的模型参数,包括:
获取所述内容差异对应的第一权重值、以及所述评分损失函数的值对应的第二权重值;
结合所述第一权重值和第二权重值,基于所述内容差异以及所述评分损失函数的值,确定所述语音降噪模型的损失函数的值;
基于所述损失函数的值,更新所述语音降噪模型的模型参数。
上述方案中,所述基于所述损失函数的值,更新所述语音降噪模型的模型参数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111025632.X/2.html,转载请声明来源钻瓜专利网。