[发明专利]基于多Agent环境的深度强化学习算法、设备和存储介质有效
申请号: | 202211114004.3 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115392438B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 王旭;周诗佳;张宇;尤天舒;徐勇;富倩;孙伟;李力东;杜丽英;戴传祗 | 申请(专利权)人: | 吉林建筑大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00;G06Q10/04 |
代理公司: | 重庆三航专利代理事务所(特殊普通合伙) 50307 | 代理人: | 万文会 |
地址: | 130118 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种基于多Agent环境的深度强化学习算法、设备和存储介质,涉及深度强化学习算法技术领域;通过步骤S101、利用Agent中的目标网络,基于初始状态信息和动作信息,确定时间差分;步骤S102、根据预设的遮盖率,对初始状态信息进行随机遮盖,得到目标状态信息,利用Agent中的预测网络,以及时间差分,确定误差值;步骤S103:基于误差值,以及自适应修改参数,对Agent中的预测网络和目标网络各自对应的加权值进行更新;步骤S104:重复步骤S102和步骤S103预设次数,确定目标加权值,从而确定目标深度强化学习模型。具有保证了样本学习效率,并通过自适应修改参数对深度强化学习模型中的Agent进行迭代更新,以提高收敛速度的效果。 | ||
搜索关键词: | 基于 agent 环境 深度 强化 学习 算法 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林建筑大学,未经吉林建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211114004.3/,转载请声明来源钻瓜专利网。