[发明专利]一种多源异构网络安全知识图谱构建方法及装置在审
| 申请号: | 202011059788.5 | 申请日: | 2020-09-30 |
| 公开(公告)号: | CN112131882A | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 章瑞康;袁军;周娟;李文瑾 | 申请(专利权)人: | 绿盟科技集团股份有限公司;北京神州绿盟科技有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/284;G06N3/04;G06N3/08 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王媛媛 |
| 地址: | 100089 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多源异构 网络安全 知识 图谱 构建 方法 装置 | ||
1.一种多源异构网络安全知识图谱构建方法,其特征在于,包括:
响应于构建网络安全知识图谱的触发请求,根据预设网络安全知识本体定义的实体和实体间的关系,从采集的网络安全领域数据集中的半结构化数据集和结构化数据集中抽取相匹配的实体和实体间的关系,生成结构化资源描述框架RDF三元组,所述网络安全知识本体是根据网络安全领域的相关网络安全标准构建的,所述网络安全知识本体定义了所述网络安全领域的实体和实体间的关系;
根据实体的不同类别按照预设识别方式从所述网络安全领域数据集中的非结构化数据集中识别与所述网络安全知识本体定义的实体相匹配的实体,所述非结构化数据集中的数据为文本数据;
将所述文本数据输入词向量识别模型中,获得从所述非结构化数据集中识别的各实体的词向量;
根据从所述非结构化数据集中识别的每两个相邻的实体之间的字符间隔选择实体对,将选择的各实体对以及对应的词向量输入关系抽取模型中,获得所述各实体对之间的关系,并根据所述各实体对以及对应的词向量、和所述各实体对之间的关系生成融合实体的词向量的结构化RDF三元组;
根据所述结构化RDF三元组和所述融合实体的词向量的结构化RDF三元组构建网络安全知识图谱。
2.如权利要求1所述的方法,其特征在于,根据实体的不同类别按照预设识别方式从所述非结构化数据集中识别与所述网络安全领域的实体相匹配的实体,具体包括:
根据预设正则表达式从所述文本数据中识别相匹配的预设类别的实体;
利用实体识别模型从所述文本数据中识别所述预设类别的实体之外的实体,其中,所述实体识别模型是对样本集中的所述网络安全领域的实体进行序列标注后按照预设训练模型训练获得的。
3.如权利要求1或2所述的方法,其特征在于,根据从所述非结构化数据集中识别的每两个相邻的实体之间的字符间隔选择实体对,具体包括:
确定从所述非结构化数据集中识别的每两个相邻的实体之间间隔的字符个数;
删除间隔的字符个数大于预设阈值、且不符合所述网络安全知识本体定义的关系的实体对;
将剩余的实体对确定为选择的实体对。
4.如权利要求1所述的方法,其特征在于,所述网络安全知识本体包括N层,第一层本体为所述网络安全知识顶层本体,每一层本体是对其上一层本体的进一步分类,所述网络安全知识顶层本体至少包括以下实体:公共漏洞和暴露CVE,通用弱点枚举CWE,国家信息安全漏洞库CNNVD,通用平台枚举CPE,通用攻击模式枚举和分类CAPEC,对抗性战术、技术和公共知识ATTCK,结构化威胁信息表达式STIX,以及恶意软件MALWARE。
5.如权利要求1所述的方法,其特征在于,还包括:
根据待查询实体的词向量在所述网络安全知识图谱中查询与所述待查询实体匹配的实体。
6.如权利要求5所述的方法,其特征在于,根据待查询实体的词向量在所述网络安全知识图谱中查询与所述待查询实体匹配的实体,具体包括:
确定所述待查询实体所属的类别;
分别计算所述待查询实体的词向量与所述网络安全知识图谱中的与所述待查询实体的类别相同的各实体的词向量之间的余弦相似度,获取所述余弦相似度大于或等于预设阈值时对应的与所述待查询实体的类别相同的实体,组成第一实体集合;
在所述网络安全知识图谱中查找与目标实体相关联的第一实体,将与所述待查询实体的类别相同的第一实体组成第二实体集合;
比对所述第一实体集合与所述第二实体集合中的各实体,当确定所述第一实体集合与所述第二实体集合中存在相同的实体时,将所述相同的实体确定为与所述待查询实体匹配的实体。
7.如权利要求1所述的方法,其特征在于,还包括:
根据图表示学习模型获取所述网络安全知识图谱上的各实体的图向量,所述实体的图向量表征所述安全网络知识图谱上的实体的向量表示;
针对每一实体,将所述实体的图向量和所述实体的词向量进行拼接,将拼接后的向量确定为所述实体的目标实体向量;
根据任意两个实体的目标实体向量和知识预测模型预测所述任意两个实体之间的关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绿盟科技集团股份有限公司;北京神州绿盟科技有限公司,未经绿盟科技集团股份有限公司;北京神州绿盟科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011059788.5/1.html,转载请声明来源钻瓜专利网。





