[发明专利]使用说话者嵌入和所训练的生成模型的说话者日志在审
申请号: | 201880094528.6 | 申请日: | 2018-09-25 |
公开(公告)号: | CN112262431A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 伊格纳西奥·洛佩斯·莫雷诺;路易斯·卡洛斯·科博鲁斯 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/20;G10L15/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;邓聪惠 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 说话者日志技术,使得能够处理音频数据以生成音频数据的一个或多个细化版本,其中,音频数据的每个细化版本分离单个相应的人类说话者的一个或多个话语。各种实现方式通过以下来生成分离单个人类说话者的话语的音频数据的细化版本:为单个人类说话者生成说话者嵌入,并且使用所训练的生成模型来处理音频数据,以及在处理期间,在确定所训练的生成模型的隐藏层的激活中使用说话者嵌入。基于该处理,在所训练的生成模型上生成输出,并且该输出是音频数据的细化版本。 | ||
搜索关键词: | 使用 说话 嵌入 训练 生成 模型 日志 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880094528.6/,转载请声明来源钻瓜专利网。