[发明专利]基于双向信号博弈的主动防御策略选取方法及装置有效
申请号: | 201911122965.7 | 申请日: | 2019-11-16 |
公开(公告)号: | CN111064702B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 刘小虎;张玉臣;张恒巍;汪永伟;邵璐璐;吕文雷;罗泽宇;于志超 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N5/04 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 石丹丹 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 信号 博弈 主动 防御 策略 选取 方法 装置 | ||
1.一种基于双向信号博弈的主动防御策略选取方法,其特征在于,包含以下步骤:
步骤1,构建双向攻防信号博弈模型分析双向攻防信号传递过程;具体包括:
网络攻防对抗具有动态性和持续性,攻击方和防御方序贯行动,一方在观测到另一方所释放的信号后,依据观测结果选择行动策略;双向攻防信号传递过程包括初始配置和动态对抗;初始配置:防御方为信号发送者,攻击方为信号接收者,防御方释放信号,攻击方观测到该信号,修正对防御方类型的先验判断,选择攻击策略;动态对抗:攻防双方在信号发送者和信号接收者角色之间不断转换,每阶段均由基本信号博弈组成,博弈终止条件是攻击方停止攻击行为,不再释放信号;
针对实际网络对抗过程攻防信号的双向传递影响机制,构建双向攻防信号博弈模型,双向攻防信号博弈模型通过十元组表示:其中,N表示局中人空间,Θ表示类型空间,H表示信号空间,T表示博弈阶段数,σ表示欺骗信号衰减因子,ξ表示收益折现因子,S表示策略空间,P表示先验概率空间,表示后验概率空间,U表示收益空间;
针对双向攻防信号博弈模型,量化博弈收益,具体是,利用折现因子ξ将未来收益进行折现,攻防双方收益目标函数可分别表示为:
其中,SDC表示系统损失代价,AC表示攻击代价,DAC表示欺骗攻击代价,DC表示防御代价,DDC表示欺骗防御代价,dg表示防御策略,ah表示攻击策略,t表示博弈阶段,SDC(dg,ah)表示当防御策略为dg、攻击策略为ah时系统遭受损失的值;
步骤2,信号发送者释放信号,信号接收者接收信号;
步骤3,求解双向信号博弈均衡,防御方依据自身角色和博弈均衡确定主动防御策略;具体包括:
信号接收者根据信号接收者收益计算最佳策略f*(h);
信号发送者根据信号发送者收益计算最佳策略h*(Θ);
信号接收者依据Bayes法则和欺骗信号计算信号发送者类型的
精炼选取符合条件的均衡解其中,f*(h)表示信号接收者针对信号发送者策略h*(Θ)的最优策略,h*(Θ)表示信号发送者针对信号接收者策略f*(h)的最优策略,表示信号接收者通过Bayes法则计算得到的信号发送者类型的后验概率;
根据博弈均衡EQt确定主动防御策略;
判断博弈阶段t是否到达阶段博弈总数T,若否,则进行下一阶段博弈均衡求解,若是,则博弈终止。
2.根据权利要求1所述的基于双向信号博弈的主动防御策略选取方法,其特征在于,所述基本信号博弈过程是,信号发送者释放信号,信号接收者观测到该信号后,使用Bayes法则,由先验概率得到后验概率,然后选择行动策略。
3.根据权利要求1所述的基于双向信号博弈的主动防御策略选取方法,其特征在于,所述欺骗信号是与行为者真实类型不相符的信号,行为者为掩盖真实类型,通过发送与其不相符的信号,诱使信号接收者对先验概率做出错误修正,从而陷入被动状态。
4.一种基于双向信号博弈的主动防御策略选取装置,其特征在于,包含:
双向攻防信号博弈模型构建模块,用于构建双向攻防信号博弈模型分析双向攻防信号传递过程;具体包括:
网络攻防对抗具有动态性和持续性,攻击方和防御方序贯行动,一方在观测到另一方所释放的信号后,依据观测结果选择行动策略;双向攻防信号传递过程包括初始配置和动态对抗;初始配置:防御方为信号发送者,攻击方为信号接收者,防御方释放信号,攻击方观测到该信号,修正对防御方类型的先验判断,选择攻击策略;动态对抗:攻防双方在信号发送者和信号接收者角色之间不断转换,每阶段均由基本信号博弈组成,博弈终止条件是攻击方停止攻击行为,不再释放信号;
针对实际网络对抗过程攻防信号的双向传递影响机制,构建双向攻防信号博弈模型,双向攻防信号博弈模型通过十元组表示:其中,N表示局中人空间,Θ表示类型空间,H表示信号空间,T表示博弈阶段数,σ表示欺骗信号衰减因子,ξ表示收益折现因子,S表示策略空间,P表示先验概率空间,表示后验概率空间,U表示收益空间;
针对双向攻防信号博弈模型,量化博弈收益,具体是,利用折现因子ξ将未来收益进行折现,攻防双方收益目标函数可分别表示为:
其中,SDC表示系统损失代价,AC表示攻击代价,DAC表示欺骗攻击代价,DC表示防御代价,DDC表示欺骗防御代价,dg表示防御策略,ah表示攻击策略,t表示博弈阶段,SDC(dg,ah)表示当防御策略为dg、攻击策略为ah时系统遭受损失的值;
信号收发模块,用于信号发送者释放信号,信号接收者接收信号;
双向信号博弈均衡求解模块,用于求解双向信号博弈均衡,防御方依据自身角色和博弈均衡确定主动防御策略,具体包括:
信号接收者根据信号接收者收益计算最佳策略f*(h);
信号发送者根据信号发送者收益计算最佳策略h*(Θ);
信号接收者依据Bayes法则和欺骗信号计算信号发送者类型的
精炼选取符合条件的均衡解其中,f*(h)表示信号接收者针对信号发送者策略h*(Θ)的最优策略,h*(Θ)表示信号发送者针对信号接收者策略f*(h)的最优策略,表示信号接收者通过Bayes法则计算得到的信号发送者类型的后验概率;
根据博弈均衡EQt确定主动防御策略;
判断博弈阶段t是否到达阶段博弈总数T,若否,则进行下一阶段博弈均衡求解,若是,则博弈终止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911122965.7/1.html,转载请声明来源钻瓜专利网。