[发明专利]基于文本和音频的实时面部再现在审
申请号: | 202080007732.7 | 申请日: | 2020-01-18 |
公开(公告)号: | CN113228163A | 公开(公告)日: | 2021-08-06 |
发明(设计)人: | 帕维尔·萨夫琴科夫;马克西姆·卢金;亚历山大·马什拉博夫 | 申请(专利权)人: | 斯纳普公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G06K9/00;G06K9/46 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 梁丽超 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 提供了用于基于文本和音频的实时面部再现的系统和方法。示例方法包括:接收输入文本和目标图像,该目标图像包括目标面部;基于输入文本生成表示输入文本的声学特征集合的序列;基于声学特征集合的序列确定指示目标面部的修改以用于发音输入文本的场景数据集合的序列;基于场景数据集合的序列生成帧序列,其中,每一帧包括基于场景数据集合中的至少一个修改的目标面部;基于帧序列生成输出视频;并且基于声学特征集合的序列合成音频数据并将该音频数据添加到输出视频。 | ||
搜索关键词: | 基于 文本 音频 实时 面部 再现 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯纳普公司,未经斯纳普公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202080007732.7/,转载请声明来源钻瓜专利网。
- 上一篇:步行自动化机器人系统
- 下一篇:天然物质的选择性萃取方法