[发明专利]声音转换模型的训练方法、电子设备及存储介质在审
| 申请号: | 202011627564.X | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112802462A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 陈言年;刘利娟;胡亚军;江源 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L25/18;G10L25/24;G10L13/02 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 声音 转换 模型 训练 方法 电子设备 存储 介质 | ||
本申请公开了一种声音转换模型的训练方法、电子设备及存储介质。该方法包括:从第一语音数据集中获取第一训练语音数据,其中,第一语音数据集中包括目标说话人的多条语音数据,第一训练语音数据对应第一声学特征;获取第一声学特征对应的后验概率特征;将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型,得到第一平行特征;获取第一平行特征对应的后验概率特征;将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型,得到第二声学特征;基于第二声学特征和第一声学特征之间的差异,调整声音转换模型的参数。通过上述方式,能够提高声音转换模型的转换效果。
技术领域
本申请涉及语音合成领域,特别是涉及一种声音转换模型的训练方法、电子设备及存储介质。
背景技术
声音转换是指利用声音转换模型对源说话人的语音数据进行转换,使其具有目标说话人的音色,同时能够保持语音数据的语义内容不变。该技术具有广泛的应用前景和实用价值。例如,该技术可以用来丰富合成语音数据效果。将该技术与语音数据合成系统相结合,可以方便快捷地生成具有不同音色的语音数据。相对于传统语音数据合成系统需要录制数小时语料,声音转换系统一般只需要几十句的训练语料,可以大大降低合成系统的构建代价。此外,说话人声音转换技术还可以用于娱乐领域进行影视配音或者游戏中实现角色扮演,用于安全领域进行身份隐藏,以及用于医疗领域进行辅助发声等等。
然而,现有的训练方法得到的声音转换模型的转换效果不佳。
发明内容
本申请提供一种声音转换模型的训练方法、电子设备及存储介质,能够解决现有的训练方法得到的声音转换模型的转换效果不佳的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种声音转换模型的训练方法。该方法包括:从第一语音数据集中获取第一训练语音数据,其中,第一语音数据集中包括目标说话人的多条语音数据,第一训练语音数据对应第一声学特征;获取第一声学特征对应的后验概率特征;将第一声学特征对应的后验概率特征和第一辅助音色特征输入声音转换模型,得到第一平行特征,其中,第一辅助音色特征不属于目标说话人;获取第一平行特征对应的后验概率特征;将第一平行特征对应的后验概率特征和目标音色特征输入声音转换模型,得到第二声学特征,其中,目标音色特征属于目标说话人;基于第二声学特征和第一声学特征之间的差异,调整声音转换模型的参数。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备包括处理器、与处理器连接的存储器,其中,存储器存储有程序指令;处理器用于执行存储器存储的程序指令以实现上述方法。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种存储介质,存储有程序指令,该程序指令被执行时能够实现上述方法。
通过上述方式,本申请先利用声音转换模型对第一声学特征对应的后验概率特征和第一辅助音色特征进行转换,得到第一平行特征,再利用声音转换模型对第一平行特征对应的后验概率特征和目标音色特征进行转换/重构,得到第二声学特征。其中,由于第一平行特征对应的后验概率特征和目标音色特征不是从同一声学特征中提取的,因此声音转换模型在将第一平行特征转换成第二声学特征时,只能忽略第一平行特征对应的后验概率特征表征的说话人信息,避免其对转换得到第二声学特征过程的干扰,进而训练得到的声音转换模型在应用阶段会忽略源语音数据对应的后验概率特征表征的源说话人信息,提高转换效果。
附图说明
图1是本申请声音转换模型的训练方法实施例一的流程示意图;
图2是本申请声音转换模型的训练方法实施例二的流程示意图;
图3是本申请声音转换模型的训练方法实施例三的流程示意图;
图4是本申请声音转换模型的训练方法实施例四的流程示意图;
图5是本申请声音转换方法一实施例的流程示意图
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011627564.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电压校准电路和方法
- 下一篇:存取款机的调整方法、装置、电子设备以及存储介质





