[发明专利]一种自监督学习的声纹识别模型训练方法、装置及可读介质在审

专利信息
申请号: 202111591886.8 申请日: 2021-12-23
公开(公告)号: CN114464195A 公开(公告)日: 2022-05-10
发明(设计)人: 张广学;肖龙源;李稀敏;叶志坚 申请(专利权)人: 厦门快商通科技股份有限公司
主分类号: G10L17/04 分类号: G10L17/04;G10L17/06;G10L25/03
代理公司: 厦门市首创君合专利事务所有限公司 35204 代理人: 连耀忠
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 监督 学习 声纹 识别 模型 训练 方法 装置 可读 介质
【说明书】:

发明公开了一种自监督学习的声纹识别模型训练方法、装置及可读介质,主要是根据实际应用场景获取的数据存在无标签或是标签错误场景,借助优化的自监督学习的声纹识别模型训练方法来有效利用真实场景数据和持续模型优化。优化的自监督学习的声纹识别模型训练方法采用三次分类将训练数据进行分类,并根据声纹识别模型的状态合理选取训练数据进行训练,使声纹识别模型在不同的阶段获取不同的能力,第一次训练和分类使其能够较为准确地区分声纹特征差别较大的数据,第二次训练和分类使其具有能够分辨声纹相似人的特征,第三次训练和分类使模型收敛和保持固定的分类特征网络,有助于声纹识别模型的收敛性和稳定性。

技术领域

本发明涉及声纹识别领域,具体涉及一种自监督学习的声纹识别模型训练方法、装置及可读介质。

背景技术

随着声纹识别技术在公安、金融反欺诈、刑事侦查等方向的广泛应用,其应用场景越来越多及相关技术指标要求也越来越高。目前,现有的模型中,监督学习模型的效果最好,但依旧有很大的提升空间。另外,真实场景数据存在很多无标签或是标签错误情况,如何去利用这些数据来训练和优化模型,就需要发掘自监督模型的优势。

现有的自监督模型,多是在监督模型作为预训练模型,然后通过聚类方式进行伪标签标注,然后进行伪标签自监督模型训练。然而,对于大规模数据来说,监督模型的识别和辨别效果具有局限性,容易出现自监督模型效果趋近于监督模型效果。另外,聚类是在提取的声纹特征基础上进行的,比较依赖模型的性能。

发明内容

针对上述提到的实际应用场景获取的数据存在无标签或是标签错误场景、自监督模型依赖监督模型的性能等问题。本申请的实施例的目的在于提出了一种自监督学习的声纹识别模型训练方法、装置及可读介质,来解决以上背景技术部分提到的技术问题。

第一方面,本申请的实施例提供了一种自监督学习的声纹识别模型训练方法,包括以下步骤:

S1,在声纹识别模型的至少一代训练过程中使用第一训练数据进行训练,得到训练后的声纹识别模型,并通过训练后的声纹识别模型对第一训练数据进行相似度计算,得到第一相似度结果,基于第一相似度结果将第一训练数据分为第二训练数据和第三训练数据;

S2,在训练后的声纹识别模型的至少一代训练过程中使用第二训练数据进行训练,得到优化后的声纹识别模型,并通过优化后的声纹识别模型对第一训练数据进行相似度计算,得到第二相似度结果,基于第二相似度结果将第一训练数据分为第四训练数据和第五训练数据;

S3,从第五训练数据抽取一定数量的数据与第四训练数据结合为第六训练数据,在优化后的声纹识别模型的至少一代训练过程中使用第六训练数据进行训练,得到优化训练后的声纹识别模型,并通过优化训练后的声纹识别模型对第一训练数据进行相似度计算,得到第三相似度结果,基于第三相似度结果将第一训练数据分为第七训练数据和第八训练数据;

S4,重复步骤S1-S3,将第七训练数据作为第一训练数据对声纹识别模型进行训练,直至声纹识别模型达到预期效果或直至满足训练结束条件。

在一些实施例中,声纹识别模型的训练过程包括:

将训练数据中的语音数据进行VAD处理,提取有效语音片段,训练数据为第一训练数据、第二训练数据、第三训练数据、第四训练数据、第五训练数据、第六训练数据、第七训练数据和第八训练数据中的其中一个;

基于有效语音片段提取至少2或n个固定长度数据,并对至少2个固定长度数据提取语音特征,并将语音特征输入声纹识别模型,以每条语音数据自身作为标签进行计算三排名损失计算,输出声纹识别结果;

经过反向传播,更新网络参数。

在一些实施例中,步骤1中基于第一相似度结果将第一训练数据分为第二训练数据和第三训练数据具体包括:根据第一相似度结果的相似度大小排序,并在第一训练数据中选取指定间隔距离内的得分的数据作为第二训练数据,其余作为第三训练数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111591886.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top