[发明专利]一种基于阶段测试反馈的语音训练数据迭代更新方法有效

专利信息
申请号: 202110489679.5 申请日: 2021-04-30
公开(公告)号: CN113223537B 公开(公告)日: 2022-03-25
发明(设计)人: 杨莹春;魏含玉;吴朝晖 申请(专利权)人: 浙江大学
主分类号: G10L17/04 分类号: G10L17/04;G10L15/06
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 王琛
地址: 310013 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 阶段 测试 反馈 语音 训练 数据 更新 方法
【说明书】:

发明公开了一种基于阶段测试反馈的语音训练数据迭代更新方法,该方法通过不断添加阶段测试语音中的误识别语音进行训练建立参考模型,然后计算原始训练语音在参考模型上的似然得分,再依据似然得分对各类语音进行排序,按照一定的比例对排序后的各类语音进行选择得到阶段核心训练语音。通过本发明提供的语音训练数据迭代更新方法,可以持续地根据测试数据的反馈来不断地筛选高质量的训练语音,所得的阶段核心训练语音及时利用了阶段应用反馈,因而其未来的识别性能表现会越来越好;该方法适用于语音识别、说话人识别、伪造语音识别等语音分类场景。

技术领域

本发明属于语音识别技术领域,具体涉及一种基于阶段测试反馈的语音训练数据迭代更新方法。

背景技术

声纹认证系统作为一种生物认证的方式,具有采集成本低、易于获取、方便远程认证等等优势,已经广泛应用于门禁系统、金融交易和司法鉴定等等领域。随着语音合成技术飞速发展,一方面给人们带来了更方便的服务和更良好的用户体验,如真声智能客服、真声智能导航、有声读物、智能语音呼叫等等;另一方面也给声纹认证系统的安全性带来了巨大的挑战,如利用合成语音攻击声纹认证系统使其性能显著下降,因此关于合成语音检测的研究具有重要的意义。

合成语音检测的目的就是从真实语音中将合成语音检测出来。现有的关于合成语音检测的实验研究都是按照比赛设定的训练集进行训练的,通常会使用大量的训练数据;然而在实际情况中,当使用更多的训练数据时,性能反而有所下降,因为训练数据中是存在冗余的,进行数据选择是有必要的。在实际工程问题中,会遇到这样的场景:测试是分阶段进行的,当测试持续进行会得到许多测试阶段性结果,如何根据这些阶段结果反馈去选择我们的训练数据,得到更优的模型,以便在后续的测试阶段取得更好的性能,是一个值得探讨的实际问题。

发明内容

当语音分类系统在实际运行中获取阶段的测试数据后,如何利用其来迭代更新语音训练数据从而更新分类模型,使得未来的识别性能更佳;针对这个问题,本发明提供了一种基于阶段测试反馈的语音训练数据迭代更新方法,使用该方法可以在阶段测试场景利用阶段结果反馈选取高质量的核心训练语音集,使得模型在使用更少训练语音的情况下取得更好的性能,不仅节约了训练时间和能耗,而且提升了检测性能。

一种基于阶段测试反馈的语音训练数据迭代更新方法,包括如下步骤:

S1.对原始训练语音提取特征后进行训练得到原始模型;

S2.进行一轮阶段测试,根据测试语音在原始模型上的得分选出其中的误识别语音加入参考语音集合;

S3.使用参考语音集合中的语音进行训练得到参考模型;

S4.计算原始训练语音在参考模型上的匹配得分;

S5.对每类训练语音集合中的每条训练语音按照其模型得分依次进行排序;

S6.根据一定比例逐类选取排名靠前的训练语音作为本轮阶段测试的核心训练语音;

S7.对核心训练语音提取特征后进行训练得到本轮阶段测试的核心模型;

S8.进行新一轮阶段测试,根据测试语音在上一轮阶段测试所得核心模型上的得分选出其中的误识别语音加入参考语音集合,返回执行步骤S3。

进一步地,所述步骤S2的具体实现方式为:将测试语音按类别输入至原始模型中得到对应的得分,将得分较低且为本人真实语音以及得分较高且非本人真实语音的测试语音作为本阶段测试的误识别语音,并将其纳入参考语音集合中,初始参考语音集合包含已知的部分测试语音。

进一步地,所述步骤S3的具体实现方式为:对于N类语音分类任务,将参考语音集合中的语音按照所属类别划分为N个子集合,依次对各子集合中的语音提取特征后分别进行训练以获得各类语音的参考模型,即N个参考模型,N为大于1的自然数即设定的语音类别数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110489679.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top