[发明专利]记忆增强的生成时间模型在审
申请号: | 201880016434.7 | 申请日: | 2018-02-06 |
公开(公告)号: | CN110383299A | 公开(公告)日: | 2019-10-25 |
发明(设计)人: | G.D.韦恩;C-C.黄;M.C.格米西;A.A.桑托罗 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于生成例如图像的预测的观察的序列。在一个方面,一种系统,包括控制器循环神经网络和解码器神经网络,以处理潜变量集合以生成观察。外部存储器和存储器接口子系统被配置为,对于多个时间步中的每一个,从控制器接收更新的隐藏状态,通过使用更新的隐藏状态从外部存储器读取数据来生成存储器上下文向量,从存储器上下文向量确定潜变量集合,通过向解码器神经网络提供潜变量集合生成预测的观察,使用潜变量、更新的隐藏状态或两者将数据写入外部存储器,并且从潜变量生成后续时间步的控制器输入。 | ||
搜索关键词: | 外部存储器 变量集合 隐藏状态 存储器上下文 解码器 神经网络 控制器 时间步 更新 观察 计算机存储介质 循环神经网络 存储器接口 计算机程序 控制器输入 变量生成 记忆增强 时间模型 向量确定 预测 向量 写入 图像 配置 | ||
【主权项】:
1.一种系统,包括一个或多个计算机和存储指令的一个或多个存储设备,所述指令在由所述一个或多个计算机执行时使所述一个或多个计算机实现:控制器循环神经网络,其中控制器循环神经网络被配置为,对于多个时间步中的每一个:接收所述时间步的控制器神经网络输入;以及根据当前隐藏状态处理所述时间步的控制器神经网络输入,以生成所述时间步的更新的隐藏状态;解码器神经网络,其中解码器神经网络被配置为:接收解码器神经网络输入,所述解码器神经网络输入包括共同定义表征环境的观察的压缩表示的潜变量集合;以及处理包括所述潜变量集合的解码器神经网络输入,以生成表征环境的观察;外部存储器;以及存储器接口子系统,被配置为对于每个时间步执行包括以下的操作:接收所述时间步的更新的隐藏状态;通过使用更新的隐藏状态从外部存储器读取数据来生成存储器上下文向量;从至少所述存储器上下文向量确定所述时间步的潜变量集合;通过将潜变量集合作为输入提供给解码器神经网络,生成所述时间步的预测的观察;使用潜变量、更新的隐藏状态或两者将数据写入外部存储器;以及从所述时间步的潜变量生成后续时间步的控制器神经网络输入。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880016434.7/,转载请声明来源钻瓜专利网。
- 上一篇:用于连续控制任务的数据高效强化学习
- 下一篇:一种计算装置及方法