[发明专利]一种情报数据融合方法与装置有效
申请号: | 202110588184.8 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113254641B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 任传伦;王淮;刘晓影;乌吉斯古愣;俞赛赛;张先国;王玥 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所;中国电子科技集团公司第三十研究所 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295;G06K9/62 |
代理公司: | 北京丰浩知识产权代理事务所(普通合伙) 11781 | 代理人: | 李学康 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情报 数据 融合 方法 装置 | ||
1.一种情报数据融合方法,其特征在于,包括:
S1对原始网络情报数据进行预处理,获得符合情报库数据模型的结构化数据;
S2采集大量所述结构化数据并对其中每一条数据进行融合方式的标注,形成训练数据;使用训练数据对决策树模型进行机器学习训练,获得Smart规则决策树模型;所述使用训练数据对决策树模型进行机器学习训练具体为使用决策树ID3分类算法进行训练;所述训练具体为对所述结构化数据的实体类型、实体属性进行训练,约束为标注的所述结构化数据的融合方式;通过所述Smart规则包括实体融合规则和实体属性融合规则,所述实体融合规则包括实体的数据覆盖写入、数据新增写入、重复数据丢弃融合规则;所述实体属性融合规则包括实体属性的数据覆盖写入、数据新增写入、重复数据丢弃、数据追加写入、部分替换写入;
S3将所述结构化数据输入Smart规则决策树模型,获取所述结构化数据与所述情报库数据模型的Smart规则;
S4根据所述Smart规则将所述结构化数据写入所述情报库。
2.根据权利要求1所述的一种情报数据融合方法,其特征在于,所述预处理包括:
S101实体提取:对所述原始网络情报数据中的情报实体进行识别,及提取和保存实体字段;
S102实体分类:对所述情报实体进行分类,根据所述情报库数据模型的约束将所述实体字段映射到所述情报库数据模型上;
S103属性识别:识别所述情报实体的实体属性;
S104属性提取:将所述实体属性与所述情报库数据模型进行匹配,对匹配吻合的所述实体属性进行属性值的提取和处理,形成格式化的实体属性数据。
3.根据权利要求2所述的一种情报数据融合方法,其特征在于,所述训练数据具体为:
定义m类所述情报实体,定义n类所述情报实体的实体属性;
对每一条所述原始网络情报数据进行预处理,形成所述结构化数据为m+n维数据向量;
所述融合方式的标注分为对所述情报实体融合方式的标注以及对所述实体属性融合方式的标注;
所述情报实体融合方式为数据覆盖写入、数据新增写入和重复数据丢弃;
所述实体属性融合方式为数据覆盖写入、数据新增写入、重复数据丢弃、数据追加写入和部分替换写入。
4.根据权利要求3所述的一种情报数据融合方法,其特征在于,所述使用决策树ID3分类算法进行训练具体为:
步骤一:对所述训练数据计算获取当前信息熵,计算各所述n个实体属性下的分支信息熵,根据所述分支信息熵计算条件熵,进而分别计算n个属性的信息增益,从中选择所述信息增益最大的属性作为决策点并加入决策树;
步骤二:将所述信息增益最大的属性列数据从所述训练数据中移除,对当前训练数据重复步骤一,直至全部实体属性均加入决策树。
5.一种情报数据融合装置,其特征在于,包括:
预处理模块:被配置为对原始网络情报数据进行预处理,获得符合情报库数据模型的结构化数据;
模型训练模块:被配置为采集大量所述结构化数据并对其中每一条数据进行融合方式的标注,形成训练数据;使用训练数据对决策树模型进行机器学习训练,获得Smart规则决策树模型;所述使用训练数据对决策树模型进行机器学习训练具体为使用决策树ID3分类算法进行训练;所述训练具体为对所述结构化数据的实体类型、实体属性进行训练,约束为标注的所述结构化数据的融合方式;通过所述Smart规则包括实体融合规则和实体属性融合规则,所述实体融合规则包括实体的数据覆盖写入、数据新增写入、重复数据丢弃融合规则;所述实体属性融合规则包括实体属性的数据覆盖写入、数据新增写入、重复数据丢弃、数据追加写入、部分替换写入;
生成融合规则模块:被配置为将所述结构化数据输入Smart规则决策树模型,获取所述结构化数据与所述情报库数据模型的Smart规则;
数据写入模块:被配置为根据所述Smart规则将所述结构化数据写入所述情报库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所;中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第十五研究所;中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110588184.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种油气模块工艺管线焊缝的信息管理方法
- 下一篇:一种手持一体式水枪
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置