[发明专利]一种情报数据融合方法与装置有效

专利信息
申请号: 202110588184.8 申请日: 2021-05-27
公开(公告)号: CN113254641B 公开(公告)日: 2021-11-16
发明(设计)人: 任传伦;王淮;刘晓影;乌吉斯古愣;俞赛赛;张先国;王玥 申请(专利权)人: 中国电子科技集团公司第十五研究所;中国电子科技集团公司第三十研究所
主分类号: G06F16/35 分类号: G06F16/35;G06F40/295;G06K9/62
代理公司: 北京丰浩知识产权代理事务所(普通合伙) 11781 代理人: 李学康
地址: 100083 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 情报 数据 融合 方法 装置
【权利要求书】:

1.一种情报数据融合方法,其特征在于,包括:

S1对原始网络情报数据进行预处理,获得符合情报库数据模型的结构化数据;

S2采集大量所述结构化数据并对其中每一条数据进行融合方式的标注,形成训练数据;使用训练数据对决策树模型进行机器学习训练,获得Smart规则决策树模型;所述使用训练数据对决策树模型进行机器学习训练具体为使用决策树ID3分类算法进行训练;所述训练具体为对所述结构化数据的实体类型、实体属性进行训练,约束为标注的所述结构化数据的融合方式;通过所述Smart规则包括实体融合规则和实体属性融合规则,所述实体融合规则包括实体的数据覆盖写入、数据新增写入、重复数据丢弃融合规则;所述实体属性融合规则包括实体属性的数据覆盖写入、数据新增写入、重复数据丢弃、数据追加写入、部分替换写入;

S3将所述结构化数据输入Smart规则决策树模型,获取所述结构化数据与所述情报库数据模型的Smart规则;

S4根据所述Smart规则将所述结构化数据写入所述情报库。

2.根据权利要求1所述的一种情报数据融合方法,其特征在于,所述预处理包括:

S101实体提取:对所述原始网络情报数据中的情报实体进行识别,及提取和保存实体字段;

S102实体分类:对所述情报实体进行分类,根据所述情报库数据模型的约束将所述实体字段映射到所述情报库数据模型上;

S103属性识别:识别所述情报实体的实体属性;

S104属性提取:将所述实体属性与所述情报库数据模型进行匹配,对匹配吻合的所述实体属性进行属性值的提取和处理,形成格式化的实体属性数据。

3.根据权利要求2所述的一种情报数据融合方法,其特征在于,所述训练数据具体为:

定义m类所述情报实体,定义n类所述情报实体的实体属性;

对每一条所述原始网络情报数据进行预处理,形成所述结构化数据为m+n维数据向量;

所述融合方式的标注分为对所述情报实体融合方式的标注以及对所述实体属性融合方式的标注;

所述情报实体融合方式为数据覆盖写入、数据新增写入和重复数据丢弃;

所述实体属性融合方式为数据覆盖写入、数据新增写入、重复数据丢弃、数据追加写入和部分替换写入。

4.根据权利要求3所述的一种情报数据融合方法,其特征在于,所述使用决策树ID3分类算法进行训练具体为:

步骤一:对所述训练数据计算获取当前信息熵,计算各所述n个实体属性下的分支信息熵,根据所述分支信息熵计算条件熵,进而分别计算n个属性的信息增益,从中选择所述信息增益最大的属性作为决策点并加入决策树;

步骤二:将所述信息增益最大的属性列数据从所述训练数据中移除,对当前训练数据重复步骤一,直至全部实体属性均加入决策树。

5.一种情报数据融合装置,其特征在于,包括:

预处理模块:被配置为对原始网络情报数据进行预处理,获得符合情报库数据模型的结构化数据;

模型训练模块:被配置为采集大量所述结构化数据并对其中每一条数据进行融合方式的标注,形成训练数据;使用训练数据对决策树模型进行机器学习训练,获得Smart规则决策树模型;所述使用训练数据对决策树模型进行机器学习训练具体为使用决策树ID3分类算法进行训练;所述训练具体为对所述结构化数据的实体类型、实体属性进行训练,约束为标注的所述结构化数据的融合方式;通过所述Smart规则包括实体融合规则和实体属性融合规则,所述实体融合规则包括实体的数据覆盖写入、数据新增写入、重复数据丢弃融合规则;所述实体属性融合规则包括实体属性的数据覆盖写入、数据新增写入、重复数据丢弃、数据追加写入、部分替换写入;

生成融合规则模块:被配置为将所述结构化数据输入Smart规则决策树模型,获取所述结构化数据与所述情报库数据模型的Smart规则;

数据写入模块:被配置为根据所述Smart规则将所述结构化数据写入所述情报库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所;中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第十五研究所;中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110588184.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top