[发明专利]语音克隆模型的训练方法、可读存储介质和语音克隆方法有效
申请号: | 202010476440.X | 申请日: | 2020-05-29 |
公开(公告)号: | CN111696521B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 张子宁;杨晓艳;张振杰 | 申请(专利权)人: | 新加坡依图有限责任公司(私有) |
主分类号: | G10L13/06 | 分类号: | G10L13/06;G10L13/047;G10L15/06;G10L25/30 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 新加坡玛丽娜景观*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种语音克隆模型的训练方法、可读存储介质和语音克隆方法,训练方法包括:将经过预处理的语料数据输入应用于语音克隆的神经网络模型,语料数据用于训练神经网络模型,语料数据包括多个发音人的多种语言的语音数据和语音数据对应的文本数据;利用神经网络模型的发音人嵌入模块和编码器模块分别对每个发音人的语音数据和相应的文本数据进行处理,生成发音人的语音嵌入数据和相应的文本数据的文本嵌入数据;将文本嵌入数据与语音嵌入数据合并,作为注意力机制模块的输入参数,并且将语音数据作为参考标准,训练神经网络模型;在损失函数满足预定值的情况下,得到应用于语音克隆的神经网络模型。 | ||
搜索关键词: | 语音 克隆 模型 训练 方法 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新加坡依图有限责任公司(私有),未经新加坡依图有限责任公司(私有)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010476440.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种城市水体污染程度线上表征方法
- 下一篇:一种翻盖式带防护罩电气接线端子板