[发明专利]面向限时红蓝对抗问题动作空间解耦的博弈决策方法有效
申请号: | 202210079797.3 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114492749B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 耿虎军;孟楠;张加佳;姜岩松;张文宝;楚博策;韩长兴;高晓倩;王梅瑞;高峰 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N3/047;G06N3/092;G06F40/30;G06F18/23 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆;曲佳颖 |
地址: | 050081 河北省石家庄*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 限时 对抗 问题 动作 空间 博弈 决策 方法 | ||
本发明公开了一种面向限时红蓝对抗问题动作空间解耦的博弈决策方法,属于人工智能中的博弈决策领域。其包括步骤:1、将博弈问题进行抽象,完成博弈问题建模,想定结构化抽象以及基于语义的对抗场景的搭建;2、构建非完全信息下蓝方信息预测预训练模型,支持红方视角下非完全信息到完全信息的映射;3、构建单个团体的动作空间并设计评估函数,进行基于动作空间解耦的蒙特卡洛树决策;4、设计路径关联度及影响判别函数,进行基于团体影响程度的蒙特卡洛树决策后处理,完成高相关团体的动作空间设计及低相关团体的决策结果输出,最终得到博弈决策结果。本发明可求解时间受限下的复杂博弈问题,并针对大规模动作空间进行快速搜索,支持高效准确的博弈决策。
技术领域
本发明属于人工智能中的博弈决策领域,具体涉及一种面向限时红蓝对抗问题动作空间解耦的博弈决策方法。
背景技术
语义数据作为一种信息描述方式可有效的表达态势信息,传输具有低带宽、低通信压力的特点,可有效支持高对抗、窄带宽、高损毁条件下的信息传输。机器博弈决策是支撑经济、政治等多方面问题进行辅助决策的关键技术,受到了广泛的关注。随着人工智能技术的发展,博弈决策技术已在部分问题上实现了落地应用。但随着需解决的博弈问题复杂性变高,非完全信息、动作空间变大、决策时间受限等问题凸显出来,现有的博弈决策技术已不能满足需求。如何更好的优化博弈决策算法,解决语义态势背景下的决策时间受限的复杂博弈问题,成为当前研究的重点。
目前的博弈决策算法大概分为三类主流的研究方法,第一类是利用强化学习方法,基于累积博弈奖励,构建策略或估值网络,通过大量的模拟仿真实现决策;第二类是博弈论目标优化方法,设定当前奖励目标,结合优化方法进行求解得到决策结果;第三类是搜索方法,通过搜索博弈问题的各种可能情况,结合奖励得到决策结果。第一类方法大多通过构造神经网络的方法,结合大量对局数据,通过网络训练进行决策,但结果解释性差且需要大量训练。第二类方法是针对当前奖励的最优解,但往往缺乏对未来奖励回报的考虑,具有一定的局限性。第三类方法可针对累积奖励进行求解,具有较好的解释性。针对动作空间较大的复杂博弈决策问题,第三类方法中的蒙特卡洛树可以良好应用,具有较好的解释性,且无需大量历史对局数据。但像计算生成兵力问题或即时战略游戏等非完全信息问题则不可以应用,且在时间受限的情况下决策效果有待提高。故而本发明针对第三类方法进行改进,以解决语义态势为基础时间受限的非完全信息下的复杂博弈决策问题。
发明内容
本发明的目的在于提供一种面向限时红蓝对抗问题动作空间解耦的博弈决策方法,通过对语义态势信息的建模,可实现“战争迷雾”问题下的博弈对抗问题的决策,且可简化动作空间,应用于复杂对抗问题,大大减少搜索空间提高搜索准确性。
本发明采用的技术方案为:
一种面向限时红蓝对抗问题动作空间解耦的博弈决策方法,包括以下步骤:
步骤1,搭建具有迷雾效果的红蓝对抗场景,提供各自阵营视角的红蓝双方态势语义信息,同时基于建筑物进行环境抽象,引入连通性及节点将地图离散化,并明确动作空间制定原则;
步骤2,对各自阵营视角的红蓝双方态势语义信息进行解析,构建博弈数据进行非完全信息下的蓝方信息预测模型的训练,得到预训练模型BNr;
步骤3,将红方视角下基于迷雾的蓝方非完全态势语义信息及红方信息进行解析,送入蓝方信息预测模型BNr,进行未知的蓝方信息的预测,得到红方视角下的蓝方完全信息;
步骤4,建立基于连通收益矩阵、辐射概率矩阵和红蓝单元分布矩阵的联合蒙特卡洛树评估体系;
步骤5,基于步骤3得到的蓝方完全信息和步骤4得到的评估体系,针对红方每个团体构建动作空间,建立蒙特卡洛树分开决策;其中,初始时刻红方每个单元定义为1个团体,在每个团体的蒙特卡洛树决策过程中,仅对当前团体进行搜索决策,其他团体静止;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210079797.3/2.html,转载请声明来源钻瓜专利网。