[发明专利]数据清洗方法、装置、设备及介质在审
| 申请号: | 201910857773.4 | 申请日: | 2019-09-09 |
| 公开(公告)号: | CN110727663A | 公开(公告)日: | 2020-01-24 |
| 发明(设计)人: | 孟月明 | 申请(专利权)人: | 光通天下网络科技股份有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22 |
| 代理公司: | 33324 杭州创智卓英知识产权代理事务所(普通合伙) | 代理人: | 郑思思 |
| 地址: | 310051 浙江省杭州市金华市婺*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种数据清洗方法,涉及通信技术领域,用于解决现有IP及其相关数据时效性及有效性不高的问题,该方法包括以下步骤:获取原始数据,所述原始数据为IP攻击信息;删除超过预设时间段的原始数据,得到第一有效数据,将第一有效数据存入ES库,并生成第一有效数据的识别ID;根据预设关键词对所述第一有效数据进行筛选,得到第二有效数据;生成所述第二有效数据的哈希值;根据所述第二有效数据的哈希值,进行哈希去重,得到目标数据。本发明还公开了一种数据清洗装置、电子设备和计算机存储介质。本发明通过对原始数据进行时效性和重复性的清洗,进而获取时效性和有效性较高的数据。 | ||
| 搜索关键词: | 有效数据 原始数据 哈希 数据清洗 时效性 计算机存储介质 通信技术领域 数据时效性 预设时间段 电子设备 目标数据 去重 预设 清洗 删除 筛选 | ||
【主权项】:
1.一种数据清洗方法,其特征在于,包括以下步骤:/n获取原始数据,所述原始数据为IP攻击信息;/n删除超过预设时间段的原始数据,得到第一有效数据,将第一有效数据存入ES库,并生成第一有效数据的识别ID;/n根据预设关键词对所述第一有效数据进行筛选,得到第二有效数据,并保留第一有效数据的识别ID;/n生成所述第二有效数据的哈希值;/n根据所述第二有效数据的哈希值,进行哈希去重,得到目标数据。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光通天下网络科技股份有限公司,未经光通天下网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910857773.4/,转载请声明来源钻瓜专利网。





