[发明专利]用于合成数据生成的场景结构的无监督学习在审

专利信息
申请号: 202110245600.4 申请日: 2021-03-05
公开(公告)号: CN113361705A 公开(公告)日: 2021-09-07
发明(设计)人: J·德瓦兰扬;S·菲德勒;A·卡尔 申请(专利权)人: 辉达公司
主分类号: G06N3/08 分类号: G06N3/08;G06K9/62;G06F30/27
代理公司: 北京市磐华律师事务所 11336 代理人: 吴洋
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 合成 数据 生成 场景 结构 监督 学习
【说明书】:

本发明公开了一种用于合成数据生成的场景结构的无监督学习。规则集或场景语法可用于生成表示场景中对象的结构和视觉参数的场景图形。渲染器可以将该场景图形作为输入并具有在场景图形中识别的资产的内容库,可以生成具有期望的场景结构的场景合成图像,而无需在场景中手动放置任何对象。以这种方式合成的图像或环境可用于,例如为真实世界的导航应用程序生成训练数据,以及为游戏或虚拟现实体验生成虚拟世界。

相关申请的交叉引用

专利申请要求于2020年3月6日提交的名称为“桥接模拟到真实的间隙:用于合成数据生成的场景结构的无监督学习(Bridging the Sim-to-Real Gap: UnsupervisedLearning of Scene Structure for Synthetic Data Generation)”的美国临时专利申请序列号62/986,614的优先权,特此出于所有目的将其全文并入本文。

背景技术

诸如游戏、动画和模拟之类的应用程序越来越依赖于更详细和逼真的虚拟环境。在许多情况下,过程模型被用于在这些环境中合成场景,以及创建用于机器学习的标记合成数据集。为了产生逼真的和多样化的场景,专家必须仔细调整控制程序模型的许多参数。这些参数既控制生成的场景的结构(例如,场景中有多少辆汽车),也控制将对象置于有效配置中的参数。手动确定和调整这些参数以及配置这些场景的其他方面的知识的复杂性和知识量可能会限制广泛适用,并且还可能会限制所生成环境的真实性或范围。

附图说明

将参考附图描述根据本公开的各种实施例,其中:

图1A和图1B示出了根据至少一个实施例的可以生成的图像;

图2A、图2B和图2C示出了根据至少一个实施例的场景的规则和图形;

图3A、图3B和图3C示出了根据至少一个实施例的场景图形生成的阶段;

图4示出了根据至少一个实施例的用于从场景语法生成图像的过程;

图5示出了根据至少一个实施例的用于训练网络的过程;

图6示出了根据至少一个实施例的用于生成场景图形的系统的组件;

图7A示出了根据至少一个实施例的推理和/或训练逻辑;

图7B示出了根据至少一个实施例的推理和/或训练逻辑;

图8示出了根据至少一个实施例的示例数据中心系统;

图9示出了根据至少一个实施例的计算机系统;

图10示出了根据至少一个实施例的计算机系统;

图11示出了根据一个或更多个实施例的图形处理器的至少一部分;

图12示出了根据一个或更多个实施例的图形处理器的至少一部分;

图13是根据至少一个实施例的用于高级计算管线的示例数据流程图;

图14是根据至少一个实施例的用于在高级计算管线中训练、调整、实例化和部署机器学习模型的示例系统的系统图;以及

图15A和图15B示出了根据至少一个实施例的用于训练机器学习模型的过程的数据流程图,以及用于利用预训练的注释模型来增强注释工具的客户端服务器架构。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110245600.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top