[发明专利]一种网络威胁情报文档实体关系提取方法及装置有效
申请号: | 202110689400.8 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113515598B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 王栋;杨珂;李达;王合建;陈帅;潘晓婷;吕佳宇 | 申请(专利权)人: | 国网电子商务有限公司;国网雄安金融科技集团有限公司;国网区块链科技(北京)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/211;G06F40/284;G06F40/295 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
地址: | 100053 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 威胁 情报 文档 实体 关系 提取 方法 装置 | ||
本申请提供了一种网络威胁情报文档实体关系提取方法及装置,获取目标文档和目标实体集合;对目标文档进行句子拆分,得到目标文档对应的句子序列;分别将句子序列中的每N个连续的句子构建成每N个连续的句子对应的句子集合;基于目标实体集合,确定每个句子集合对应的各个目标实体;针对每个句子集合,对句子集合对应的各个目标实体进行两两组合,生成至少一个实体组合;针对每个实体组合,利用预先构建的实体关系提取模型,对实体组合和所述实体组合对应的句子集合进行处理,得到实体组合对应的实体关系结果,实现了网络威胁情报文档级别的实体关系提取,解决了威胁情报文本过长而无法有效提取关键关系问题,提升了区块链网络威胁分析能力。
技术领域
本申请涉及网络安全领域,尤其涉及一种网络威胁情报文档实体关系提取方法及装置。
背景技术
当前,面向区块链的网络攻击呈现出越来越复杂和隐蔽的趋势,导致区块链攻击分析和防御日益困难。网络威胁情报文档是基于证据的知识,包括场景、机制、指标、含义和可操作的建议,这些知识是与面临的威胁相关的情报信息。通过对已知网络威胁情报文档中实体关系的提取,进而能够实现根据提取到的网络威胁情报实体关系对未知网络威胁情报文档的检测,而网络威胁情报的准确检测对于分析和防御区块链攻击者的攻击行为具有重要意义。
现有技术中,对网络威胁情报文档中实体关系的提取,仅仅是对网络威胁情报文档中句子内部实体关系的提取,已有的网络威胁情报实体关系抽取模型会因文本过长导致无法有效提取文本的语义特征,无法实现网络威胁情报文档级别的实体关系提取,从而使得不能根据提取到的网络威胁情报实体关系进行准确的网络威胁情报的检测。
发明内容
发明人在研究过程中发现,网络威胁情报文档中,实体关系往往出现在N个连续的句子内部,通过对N个连续的句子间的实体关系的提取,能够实现网络威胁情报文档级别的实体关系提取,基于此,本申请提供了一种网络威胁情报文档实体关系提取方法及装置,目的在于解决现有的实体关系提取方法无法实现基于网络威胁情报文档级别的实体关系提取,导致无法有效提取语义特征,从而使得不能根据提取到的网络威胁情报实体关系进行准确的网络威胁情报的检测的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种网络威胁情报文档实体关系提取方法,包括:
获取目标文档和目标实体集合;所述目标文档为待提取实体关系的网络威胁情报文档;所述目标实体集合中包括多个目标实体,所述目标实体为目标文档所包括的句子中的预设文本字段;
对所述目标文档进行句子拆分,得到所述目标文档对应的句子序列;
分别将所述句子序列中的每N个连续的句子构建成每N个连续的句子对应的句子集合;所述N为大于1的正整数;
基于所述目标实体集合,确定每个句子集合对应的各个目标实体;
针对每个句子集合,对所述句子集合对应的各个目标实体进行两两组合,生成至少一个实体组合;
针对每个实体组合,利用预先构建的实体关系提取模型,对所述实体组合和所述实体组合对应的句子集合进行处理,得到所述实体组合对应的实体关系结果。
上述的方法,可选的,所述基于所述目标实体集合,确定每个句子集合对应的各个目标实体,包括:
确定所述目标实体集合中每个所述目标实体所属的句子;
针对每个句子集合,确定所述句子集合包括的各个句子,基于所述句子集合所包括的各个句子、以及所述目标实体集合中每个所述目标实体所属的句子,确定所述句子集合中包括的每个句子对应的各个目标实体;
针对每个句子集合,将所述句子集合中包括的每个句子对应的各个目标实体确定为所述句子集合对应的目标实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电子商务有限公司;国网雄安金融科技集团有限公司;国网区块链科技(北京)有限公司,未经国网电子商务有限公司;国网雄安金融科技集团有限公司;国网区块链科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110689400.8/2.html,转载请声明来源钻瓜专利网。