[发明专利]智能体训练方法、装置、计算机设备和存储介质在审
申请号: | 202111106047.2 | 申请日: | 2021-09-22 |
公开(公告)号: | CN113919482A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 陈广浩;杨洋;李锋;张琛;万化 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N3/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄丽霞 |
地址: | 200001 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及一种智能体训练方法、装置、计算机设备和存储介质。该方法包括:获取多个经验动作数据,经验动作数据为进化种群中多个目标样本智能体与环境交互学习的经验动作;基于多个经验动作数据,获取初始强化学习智能体输出的动作数据的奖励信息;根据奖励信息和预设的损失函数,对初始强化学习智能体的网络参数进行更新;若初始强化学习智能体更新后的网络参数与目标网络参数相同,则结束对初始强化学习智能体的网络参数的更新,得到训练完成的强化学习智能体。本申请将进化算法和深度强化学习相结合,可以提高深度强化学习的学习效率和效果,从而更好的控制强化智能体完成连续控制任务。 | ||
搜索关键词: | 智能 训练 方法 装置 计算机 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111106047.2/,转载请声明来源钻瓜专利网。