[发明专利]基于Markov时间博弈的移动目标防御决策选取方法、装置及系统有效
申请号: | 201910552217.6 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110300106B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 谭晶磊;张红旗;杨英杰;金辉;雷程 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 周艳巧 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 markov 时间 博弈 移动 目标 防御 决策 选取 方法 装置 系统 | ||
1.一种基于Markov时间博弈的移动目标防御决策选取方法,其特征在于,包含如下内容:
构建移动目标攻防策略集合;
分析基于Markov时间博弈的移动目标防御过程,构建Markov时间博弈移动目标防御模型;
对Markov时间博弈移动目标防御模型进行均衡求解,确定其对抗过程中最优策略;
Markov时间博弈移动目标防御模型构建中,利用动态时间博弈刻画单阶段移动目标防御博弈过程,并通过Markov决策过程刻画在不同阶段的随机迁移,将单状态单阶段时间博弈过程扩展至多状态多阶段上,通过多阶段时间博弈与Markov决策方法相结合,构建多阶段Markov时间博弈移动目标防御模型;
单状态单阶段时间博弈过程采用六元组表示的单阶段时间博弈模型STG-MTD描述,表示为STG-MTD=(N,B,R,η,U,T),其中,N表示攻防博弈参与人集合,B表示攻防博弈可行动作空间,R表示移动目标攻防双方所竞争的公共资源,η表示博弈信念集合,U表示移动目标攻防双方受益函数集合,T表示博弈总时间;
多阶段Markov时间博弈移动目标防御模型MTG-MTD采用十元组表示,表示为MTG-MTD=(N,K,R,S,f,B,η,U,β,T),其中,K表示多阶段攻防博弈阶段数,S表示不同网络攻防阶段安全状态集合,f表示状态迁移概率,β表示折现因子。
2.根据权利要求1所述的基于Markov时间博弈的移动目标防御决策选取方法,其特征在于,移动目标攻防策略集合中,移动目标攻击策略包含:移动目标攻击MTA体系中通过变换恶意软件签名实现攻击行为的多态MTA、通过动态变换恶意软件代码实现攻击行为的自修改MTA、通过隐藏恶意活动实现攻击行为的混淆MTA、通过变换恶意软件签名并隐藏恶意代码数据实现攻击行为的自加密MTA和通过变换追踪环境行为实现攻击行为的反虚拟机/反沙箱MTA;移动目标防御策略采用网络层移动目标防御MTD。
3.根据权利要求2所述的基于Markov时间博弈的移动目标防御决策选取方法,其特征在于,网络层移动目标防御MTD包含:通过变换MAC地址进行防御的MAC层MTD、通过变换IP地址进行防御的IP层MTD、通过变换网络协议进行防御的TCP层MTD、通过变换应用程序端口进行防御的会话层MTD和通过变换转发路径进行防御的路径MTD。
4.根据权利要求1所述的基于Markov时间博弈的移动目标防御决策选取方法,其特征在于,模型均衡求解过程中,从移动目标攻防双方对攻击面的控制出发,结合移动目标攻防策略组合下的攻击收益值和防御收益值,获取移动目标攻防收益矩阵,并采用折现期望回报准则函数作为博弈双方目标函数对移动目标攻防策略收益进行量化分析。
5.根据权利要求1所述的基于Markov时间博弈的移动目标防御决策选取方法,其特征在于,模型均衡求解过程中,首先,通过引入子博弈精炼纳什均衡方法,去除均衡中不可置信威胁策略的纳什均衡,确定单阶段时间博弈均衡上的最优策略;然后,通过折现因子将博弈均衡策略的求解问题转换为非线性规划最优值问题,求解得到多阶段均衡策略及其收益,进而确定攻防双方最优移动目标防御策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910552217.6/1.html,转载请声明来源钻瓜专利网。