[发明专利]多语言语音合成和跨语言话音克隆在审
| 申请号: | 202080039862.9 | 申请日: | 2020-04-22 |
| 公开(公告)号: | CN113892135A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 张羽;罗恩·J·韦斯;比扬哈·春;吴永辉;陈智峰;鲁塞尔·约翰·怀亚特·斯克里-瑞安;贾晔;安德鲁·M·罗森贝格;布瓦那·拉马巴德兰 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/02;G10L13/047 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种方法(300)包括接收要合成为第一语言的语音(150)的输入文本序列(114)并获得讲话者嵌入(116a),该讲话者嵌入指定目标讲话者(10)的特定话音特征以用于将输入文本序列合成为克隆目标讲话者的话音的语音。目标讲话者包括不同于第一语言的第二语言的母语讲话者。该方法还包括通过处理输入文本序列和讲话者嵌入来使用文本到语音(TTS)模型(100)生成输入文本序列的输出音频特征表示(119)。输出音频特征表示包括讲话者嵌入指定的目标讲话者的话音特征。 | ||
| 搜索关键词: | 语言 语音 合成 话音 克隆 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202080039862.9/,转载请声明来源钻瓜专利网。





