[发明专利]基于低阶高斯分布的多智能体协同探索方法及装置有效
| 申请号: | 202010962997.4 | 申请日: | 2020-09-14 |
| 公开(公告)号: | CN112215333B | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 马骁腾;杨以钦;陆逸文;莫一林;赵千川 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于低阶高斯分布的多智能体协同探索方法及装置,其中,该方法包括:获取多智能体决策下的状态轨迹,将状态轨迹存入数据缓存器;构建各个智能体的主值网络、各个智能体的主策略网络、QMIX主值网络、主协同探索网络、各个智能体的副值网络、各个智能体的副策略网络、QMIX副值网络、副协同探索网络;基于状态轨迹和值函数分解算法的多智能体协同探索过程,对上述构建的相关网络进行更新;根据更新的多个网络生成更新后的策略模型,对策略模型进行测试。该方法设计出一种在连续控制量的仿真环境中基于低阶高斯分布的多智能体协同探索算法。 | ||
| 搜索关键词: | 基于 低阶 分布 智能 体协 探索 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010962997.4/,转载请声明来源钻瓜专利网。





