[发明专利]模型训练方法、声纹特征的提取方法及其设备、程序产品在审
| 申请号: | 202111290709.6 | 申请日: | 2021-11-02 |
| 公开(公告)号: | CN114005453A | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 赵情恩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L25/18 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 霍莉莉;刘芳 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 声纹 特征 提取 及其 设备 程序 产品 | ||
1.一种模型训练方法,包括:
获取应用在第一场景的第一模型、第一子帧以及目标子帧,所述第一子帧是对应用在第一场景的第一音频进行分帧处理得到的,所述目标子帧是对应用在目标场景的目标音频进行分帧处理得到的;其中,所述第一音频具有标注信息;
提取所述第一子帧的第一频谱特征,并提取所述目标子帧的目标频谱特征;
根据所述第一子帧的第一频谱特征、所述第一音频的标注信息、所述目标子帧的目标频谱特征以及所述目标子帧所属的目标音频,对所述第一模型进行训练,得到目标模型。
2.根据权利要求1所述的方法,其中,根据所述第一子帧的第一频谱特征、所述第一音频的标注信息、所述目标子帧的目标频谱特征以及所述目标子帧所属的目标音频,对所述第一模型进行训练,得到目标模型,包括:
重复执行下述步骤,直到满足预设的停止训练条件:
将所述第一频谱特征以及所述目标频谱特征输入所述第一模型,得到与所述第一频谱特征对应的识别结果,以及与所述目标子帧对应的目标特征向量;
利用所述第一频谱特征的识别结果以及所述第一音频的标注信息、所述目标子帧的目标特征向量以及所述目标子帧所属的目标音频确定损失函数的值,并利用所述损失函数的值优化所述第一模型,得到优化后的第一模型;
其中,满足所述预设的停止训练条件时得到的优化后的第一模型为目标模型。
3.根据权利要求2所述的方法,其中,所述利用所述第一频谱特征的识别结果以及所述第一音频的标注信息、所述目标子帧的目标特征向量以及所述目标子帧所属的目标音频确定损失函数的值,包括:
根据所述第一频谱特征的识别结果以及所述第一音频的标注信息确定第一损失函数的值;
根据各个所述目标子帧的目标特征向量以及各个所述目标子帧所属的目标音频,确定第二损失函数的值;所述第二损失函数的值用于表征多个目标子帧的目标特征向量之间的比对信息;
根据所述第一损失函数的值、所述第二损失函数的值确定所述损失函数的值。
4.根据权利要求3所述的方法,其中,所述根据各个所述目标子帧的目标特征向量以及各个所述目标子帧所属的目标音频,确定第二损失函数的值,包括:
根据属于相同的目标音频的目标子帧的目标特征向量,确定第一比对信息;
根据属于不同的目标音频的目标子帧的目标特征向量,确定第二比对信息;
根据所述第一比对信息、所述第二比对信息,确定所述第二损失函数的值。
5.根据权利要求3或4所述的方法,其中,所述根据所述第一损失函数的值、所述第二损失函数的值确定所述损失函数的值,包括:
将所述第一损失函数的值与加权后的第二损失函数的值之间的差,确定为所述损失函数的值。
6.根据权利要求1-5任一项所述的方法,其中,所述提取所述第一子帧的第一频谱特征,包括:
针对任一第一子帧,确定该第一子帧的初始频谱特征;
获取该第一子帧的关联第一子帧,该第一子帧的关联第一子帧包括:位于该第一子帧之前的第一预设数量的第一子帧,和/或,位于该第一子帧之后的第二预设数量的第一子帧;
根据该第一子帧的关联第一子帧的初始频谱特征,确定该第一子帧的特征均值;
确定该第一子帧的初始频谱特征与该第一子帧的特征均值的差值,为该第一子帧的第一频谱特征。
7.根据权利要求1所述的方法,其中,所述提取所述目标子帧的目标频谱特征,包括:
针对任一目标子帧,
确定该目标子帧的初始频谱特征;
获取该目标子帧的关联目标子帧,该目标子帧的关联目标子帧包括:位于该目标子帧之前的第三预设数量的目标子帧,和/或,位于该目标子帧之后的第四预设数量的目标子帧;
根据该目标子帧的关联目标子帧的初始频谱特征,确定该目标子帧的特征均值;
确定该目标子帧的初始频谱特征与该目标子帧的特征均值的差值,为该目标子帧的目标频谱特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111290709.6/1.html,转载请声明来源钻瓜专利网。





