[发明专利]一种基于阶段测试反馈的语音训练数据迭代更新方法有效
申请号: | 202110489679.5 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113223537B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 杨莹春;魏含玉;吴朝晖 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L15/06 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 王琛 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 测试 反馈 语音 训练 数据 更新 方法 | ||
1.一种基于阶段测试反馈的语音训练数据迭代更新方法,包括如下步骤:
S1.对原始训练语音提取特征后进行训练得到原始模型;
S2.进行一轮阶段测试,根据测试语音在原始模型上的得分选出其中的误识别语音加入参考语音集合;
S3.使用参考语音集合中的语音进行训练得到参考模型;
S4.计算原始训练语音在参考模型上的匹配得分;
S5.对每类训练语音集合中的每条训练语音按照其模型得分依次进行排序;
S6.根据一定比例逐类选取排名靠前的训练语音作为本轮阶段测试的核心训练语音;
S7.对核心训练语音提取特征后进行训练得到本轮阶段测试的核心模型;
S8.进行新一轮阶段测试,根据测试语音在上一轮阶段测试所得核心模型上的得分选出其中的误识别语音加入参考语音集合,返回执行步骤S3。
2.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S2的具体实现方式为:将测试语音按类别输入至原始模型中得到对应的得分,将得分较低且为本人真实语音以及得分较高且非本人真实语音的测试语音作为本阶段测试的误识别语音,并将其纳入参考语音集合中,初始参考语音集合包含已知的部分测试语音。
3.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S3的具体实现方式为:对于N类语音分类任务,将参考语音集合中的语音按照所属类别划分为N个子集合,依次对各子集合中的语音提取特征后分别进行训练以获得各类语音的参考模型,即N个参考模型,N为大于1的自然数即设定的语音类别数。
4.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S4的具体实现方式为:首先对原始训练语音按照语音类别进行分类后得到N个类训练语音集合,然后依次对各类训练语音集合中的原始训练语音提取特征后输入其对应类别的参考模型中,以计算输出得到各条训练语音的匹配得分即模型得分。
5.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S5的具体实现方式为:根据步骤S4所获得的所有训练语音的匹配得分,按照语音类别对每一类训练语音集合中的训练语音以其模型得分从高到低进行排序。
6.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S6的具体实现方式为:根据步骤S5得到的各类训练语音集合中的语音排列顺序,按照一定的比例选择排名靠前的训练语音作为各类别在本轮阶段测试的核心训练语音。
7.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S7的具体实现方式为:对于N类语音分类任务,将本轮阶段测试的核心训练语音按照所属类别划分为N个集合,依次对各集合中的核心训练语音提取特征后分别进行训练以获得各类语音在本轮阶段测试的核心模型,即N个核心模型。
8.根据权利要求1所述的语音训练数据迭代更新方法,其特征在于:所述步骤S8的具体实现方式为:将测试语音按类别输入至上一轮阶段测试的核心模型中得到对应的得分,将得分较低且为本人真实语音以及得分较高且非本人真实语音的测试语音作为本阶段测试的误识别语音,并将其纳入到本阶段的参考语音集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110489679.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:刚性脱模成型装置
- 下一篇:一种线圈热压系统及工艺