[发明专利]人机对抗分布式训练系统和方法有效
申请号: | 202110489058.7 | 申请日: | 2021-05-06 |
公开(公告)号: | CN112990460B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 尹奇跃;黄凯奇;赵美静 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孙剑锋;李雪 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供通用的人机对抗分布式训练系统和方法,包括:控制端、训练端、数据生成端、环境推演端、数据存储端以及模型存储端;控制端负责启动训练、对手模型选择、终止训练;训练端负责基于强化学习算法进行决策网络的训练和参数更新,并将训练更新的参数传递给所述数据生成端和将待保存的参数传递给模型存储端;数据生成端负责从训练端和模型存储端提取决策网络参数,提取状态特征,并基于决策网络的参数生成动作;数据生成端负责将训练数据传递给数据存储端和接收数据生成端传递的动作进行仿真环境推演;数据存储端负责保存数据和将数据传递给训练端;模型存储端负责保存决策网络参数,构成模型集合和将决策网络参数传递给数据生成端。 | ||
搜索关键词: | 人机 对抗 分布式 训练 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110489058.7/,转载请声明来源钻瓜专利网。