[发明专利]基于深度强化学习的大规模网络瓦解方法、存储装置以及存储介质在审
| 申请号: | 201910019488.5 | 申请日: | 2019-01-09 |
| 公开(公告)号: | CN109754085A | 公开(公告)日: | 2019-05-14 |
| 发明(设计)人: | 刘忠;范长俊;曾利;孙怡舟;程光权 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06Q50/00 |
| 代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 邱轶 |
| 地址: | 410073 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提出了一种基于深度强化学习的大规模网络瓦解方法、存储装置以及计算机可读存储介质,所述方法包括以下步骤:训练网络表示学习模型,其中,网络表示学习模型为网络的节点到其对应特征向量映射的神经网络模型;根据网络表示学习模型和强化学习算法训练网络瓦解模型,其中,网络瓦解模型为拟合强化学习Q值函数的神经网络模型;通过网络瓦解模型对目标网络进行网络瓦解。该方法能够系统解决常规网络瓦解问题和广义网络瓦解问题,扩展性较强,且所需先验知识少,只需将网络本身作为输入,根据不同问题定义相应的奖励函数就可高效地学习网络瓦解策略,其解决问题的规模可以扩展到千万级节点以上,应用场景十分广阔。 | ||
| 搜索关键词: | 瓦解 强化学习 网络 神经网络模型 大规模网络 存储装置 网络表示 训练网络 计算机可读存储介质 学习 强化学习算法 扩展性 常规网络 存储介质 广义网络 目标网络 特征向量 问题定义 先验知识 应用场景 拟合 映射 奖励 | ||
【主权项】:
1.一种基于深度强化学习的大规模网络瓦解方法,其特征在于,包括以下步骤:训练网络表示学习模型,其中,所述网络表示学习模型为网络的节点到与所述节点对应的特征向量映射的神经网络模型;根据所述网络表示学习模型和强化学习算法训练网络瓦解模型,其中,所述网络瓦解模型为拟合强化学习Q值函数的神经网络模型;通过所述网络瓦解模型对目标网络进行网络瓦解。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910019488.5/,转载请声明来源钻瓜专利网。





