[发明专利]一种基于增强学习的动态保护路径规划方法有效

申请号：	201710048160.7	申请日：	2017-01-20
公开（公告）号：	CN106657144B	公开（公告）日：	2019-06-28
发明（设计）人：	胡昌振;陈韵;吕坤	申请（专利权）人：	北京理工大学
主分类号：	H04L29/06	分类号：	H04L29/06;H04L12/24
代理公司：	北京理工正阳知识产权代理事务所(普通合伙) 11639	代理人：	毛燕
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于增强学习的动态保护路径规划方法，属于信息安全技术领域。具体操作步骤为：步骤一、生成分布式的网络攻击图。步骤二、寻找最差攻击路径。步骤三、生成网络模型。步骤四、通过增强学习，获取最佳保护路径。本发明提出的方法与已有技术相比较，具有以下优点：①不需要收集训练数据，对网络模型进行训练。②可以在线学习，不断确定不同时刻不同网络状态对应的最佳保护路径。③对传输数据的保护程度高。④最优保护路径生成速度快。
搜索关键词：	一种基于增强学习动态保护路径规划方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于增强学习的动态保护路径规划方法，其特征在于：其具体操作为：步骤一、生成分布式的网络攻击图；具体为：步骤1.1：使用2个以上搜索代理同时搜索网络中未被使用的特权节点，并将它们压入各搜索代理的搜索栈中；步骤1.2：将特权节点进行扩展；步骤1.3：搜索栈中没有特权节点的搜索代理，依次向其他搜索代理请求一个或多个特权节点；具体为：搜索栈中没有特权节点的搜索代理向一个搜索代理请求一个或多个特权节点，如果当前被请求搜索代理中没有特权节点返回给请求搜索代理，则请求搜索代理向下一个其它搜索代理发送请求；如果被请求代理有特权节点返回给请求代理，即搜索代理获得特权节点，则返回到步骤1.2，并重复步骤1.2至1.3的操作；如果全部其他搜索代理都没有特权节点返回给请求代理，那么将当前没有特权节点的搜索代理设置为挂起模式；步骤1.4：当所有搜索代理都进入挂起模式时，搜索结束，执行步骤1.5的操作；步骤1.5：将每个搜索代理的子攻击图更新，然后汇总到总代理，生成分布式的网络攻击图；步骤二、寻找最差攻击路径；在步骤一操作的基础上，使用通用安全漏洞评估系统CVSS对步骤一生成的网络攻击图中的所有原子攻击添加攻击成功率，并通过公式(0)计算攻击路径成功率；所述原子攻击为单次对漏洞的利用或对信息源的使用的攻击；Pr＝pr₀×pr₁×......×pr_n‑1 (0)其中，Pr表示攻击路径成功率；pr₀、pr₁、.....、pr_n‑1分别表示第1条边到第n条边的攻击成功率；然后，选取攻击路径成功率最低的一条路径作为最差攻击路径，得到特权节点集合；步骤三、生成网络模型；步骤三与步骤一同步操作，具体为：步骤3.1：获取主机中的软件应用和网络接口；步骤3.2：获取各个网络接口所联系的IP地址和会话链接；步骤3.3：获取各个软件应用所使用的端口号、IP地址、信息源以及所述软件应用的后端应用；步骤3.4：根据步骤3.1至3.3得到的各参数之间的逻辑关系建立网络模型；步骤四、通过增强学习，获取最佳保护路径；具体为：步骤4.1：用符号V*(S)表示在状态S下的收益最优值，则收益最优值函数如公式(1)所示；V*(S)＝max(π)Vπ(S) (1)其中，S为前置状态；π表示政策；max(π)Vπ(S)表示在状态S下，选取政策π使得总收益函数Vπ(S)最大化；步骤4.2：将公式(1)转换为贝尔曼方程，如公式(2)所示；其中，V(S)为在状态S下的收益值；R(S)为奖励函数；γ为贴现因子，γ∈(0,1)；S'为后置状态；a表示动作；Psa(S')表示在状态S下，通过动作a转换到S'状态的概率；V*(S')表示在状态S′下的收益最优值；步骤4.3：初始化V(S)＝0，同时设置V*(S)的阈值，用符号σ表示，σ≥10000；对公式(2)进行迭代，直到V(S)收敛于V*(S)，获取此时的政策π，得到网络节点集合；步骤4.4：如果步骤二得到的最差攻击路径对应的攻击路径成功率Pr＞d，d为人为设定的阈值，d∈[0.1,0.3]，则步骤4.3得到网络节点集合对应的传输路径为最优保护路径，结束操作；否则，执行步骤4.5的操作；步骤4.5：用步骤4.3得到的网络节点集合与步骤二得到的特权节点集合取交集，得到信息传输节点集合；如果信息传输节点集合不为空，则信息传输节点集合对应的传输路径即为最优保护路径；如果信息传输节点集合为空，则在步骤二中向上查找次差攻击路径以及对应的特权节点集合，然后重复步骤4.3至步骤4.5的操作，得到信息传输节点集合；如果信息传输节点集合依然为空，则在步骤二中继续向上查找，重复步骤4.3至步骤4.5的操作。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学，未经北京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710048160.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L29-00 H04L 1/00至H04L 27/00单个组中不包含的装置、设备、电路和系统
H04L29-02 .通信控制；通信处理
H04L29-12 .以数据终端为特征的
H04L29-14 .故障的应对措施
H04L29-04 ..用于多条通信线路的
H04L29-06 ..以协议为特征的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于增强学习的动态保护路径规划方法有效

专利文献下载