[发明专利]一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法在审

申请号：	202211267660.7	申请日：	2022-10-17
公开（公告）号：	CN115883129A	公开（公告）日：	2023-03-31
发明（设计）人：	杨柯	申请（专利权）人：	北京元支点信息安全技术有限公司
主分类号：	H04L9/40	分类号：	H04L9/40
代理公司：	北京贵都专利代理事务所(普通合伙) 11649	代理人：	田志华
地址：	100000 北京市东***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种诱骗博弈均衡强化学习模型对抗蜜罐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法，其特征在于，包括以下步骤：

S1:通过策略欺骗满足状态，同时将此状态嵌入Agent智能体和环境模块中；

S2:智能体通过学习，并动作与环境模块；

S3：环境模块对评估信号传递信号，并对行动行动网络信号；

S4:评估网络传递信号到时序查分方法的同时，接收由评估网络产生的内部增强信号；

S5：时序差分方法将信号传递到遗传算法的同时，接收由评估网络产生的增强信号；

S6：行动网络接收由环境模块传递的信号的同时，接收由遗传算法传递到神经网络构造器的信号。

2.根据权利要求1所述的一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法，其特征在于，步骤S1具体为通过策略欺骗提高蜜罐诱骗程度η，合理部署蜜罐概率q，满足(γa-b)/(γa+ηc)＜q＜1/2的均衡状态，从而影响攻击者对蜜罐部署概率q的后验概率判断，提高诱骗主动性，将均衡条件嵌入Agent智能体和环境模块中，进而对下一步动作占据主动优势。

3.根据权利要求1所述的一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法，其特征在于，步骤S1具体为：Agent智能体以“试错”的方式进行学习，并通过与环境进行交互获得的奖赏指导行为，使智能体获得最大的奖赏。

4.根据权利要求1所述的一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法，其特征在于，步骤S2具体为：将均衡状态嵌入Agent智能体和环境模块中，进而对下一步动作占据主动优势。

5.根据权利要求1所述的一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法，其特征在于，步骤S4具体为：环境模块中提供的强化信号为内部增强产生的好坏作评估。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京元支点信息安全技术有限公司，未经北京元支点信息安全技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211267660.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种事件预测方法及装置
下一篇：一种基于静止卫星的定位方法、系统、电子设备及介质

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L9-00 保密或安全通信装置
H04L9-06 .使用移位寄存器或存储器用于块式码的密码装置，例如dES系统
H04L9-10 .带有特殊机体，物理特征或人工控制
H04L9-12 .同步的或最初建立特殊方式的发送和接收密码设备
H04L9-14 .使用多个密钥或算法
H04L9-18 .用串行和连续修改数据流单元加密，例如数据流加密系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种诱骗博弈均衡与强化学习模型对抗反蜜罐的方法在审

专利文献下载