[发明专利]一种基于深度强化学习的对抗仿真推演方法有效
| 申请号: | 202110655273.X | 申请日: | 2021-06-11 |
| 公开(公告)号: | CN113298260B | 公开(公告)日: | 2022-07-26 |
| 发明(设计)人: | 曾向荣;钟志伟;张政;刘衍 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/08;G06N3/04 |
| 代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410073 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于深度强化学习的对抗仿真推演方法,该方法在对抗终端进行人机操作和机器自主学习操作,通过人‑机对抗训练生成训练样本数据、机‑机对抗训练通过深度卷积神经网络生成大量训练样本数据,所述训练样本数据包括单智能体的奖励值;深度卷积神经网络将多个单智能体的状态和所述奖励值生成多智能体联合状态和联合奖励值,输入深度强化学习模型,所述深度强化学习模型输出联合决策行动,生成多智能体对抗决策;将所述多智能体对抗决策反馈输入深度强化学习模型,实现无监督的自我学习。本发明在对抗想定已知的情况下,通过改变多智能体编队、分组、战术配合等达到了对抗仿真推演中电子假想对抗方效能评估最优的目标。 | ||
| 搜索关键词: | 一种 基于 深度 强化 学习 对抗 仿真 推演 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110655273.X/,转载请声明来源钻瓜专利网。





