[发明专利]生成对抗网络训练方法、音频风格迁移方法及装置在审
申请号: | 202011270010.9 | 申请日: | 2020-11-13 |
公开(公告)号: | CN112562728A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 陈江;胡正伦 | 申请(专利权)人: | 百果园技术(新加坡)有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/24;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 新加坡巴西班让路*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开一种生成对抗网络训练方法、音频风格迁移方法及装置,训练方法包括:获取内容音频数据和风格音频数据;将风格音频数据输入说话人向量提取模型得到说话人向量;获取内容音频数据的原始频谱参数和原始梅尔倒谱参数;基于说话人向量、原始频谱参数以及原始梅尔倒谱参数训练生成对抗网络,生成对抗网络的生成器用于输入说话人向量、原始频谱参数以及原始梅尔倒谱参数后生成目标频谱参数和目标梅尔倒谱参数,目标频谱参数和目标梅尔倒谱参数用于合成具有风格音频数据的音频风格的目标音频数据。在使用生成器对原说话人的音频数据进行风格迁移时,可以提取任意说话人的说话人向量输入到生成器中,实现了集合外音频风格迁移。 | ||
搜索关键词: | 生成 对抗 网络 训练 方法 音频 风格 迁移 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百果园技术(新加坡)有限公司,未经百果园技术(新加坡)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011270010.9/,转载请声明来源钻瓜专利网。