[发明专利]一种基于人工智能的大数据采集存储系统及方法在审

专利信息
申请号: 202011293708.2 申请日: 2020-11-18
公开(公告)号: CN112445958A 公开(公告)日: 2021-03-05
发明(设计)人: 张泽华;陈文辉;邓世川;连滨猛 申请(专利权)人: 厦门物之联智能科技有限公司
主分类号: G06F16/951 分类号: G06F16/951
代理公司: 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 代理人: 邱冬新
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 人工智能 数据 采集 存储系统 方法
【说明书】:

发明公开了大数据抓取技术领域的一种基于人工智能的大数据采集存储系统,该基于人工智能的大数据采集存储系统包括:抓取系统,通过所述抓取系统对全网的公开数据进行抓取;防火墙系统,所述防火墙的输入端链接到所述抓取系统的输出端上;临时存储系统,所述临时存储系统的输入端链接到所述防火墙系统的输出端上,经过所述防火墙系统的数据输入到所述临时存储系统内进行临时存储;存储系统,所述存储系统的输入端链接到所述临时存储系统的输出端上,本发明通过防火墙以及临时存储系统对抓取的数据进行过滤,隔离清查等方式对抓取的数据进行处理,减少了对无用数据的存储,并且提高了数据的安全性。

技术领域

本发明涉及大数据抓取技术领域,具体为一种基于人工智能的大数据采集存储系统及方法。

背景技术

大数据,IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

随着信息化时代的到来,云计算技术、数字技术、互联网技术等获得了进一步的发展和应用,信息产业的竞争力也在不断的加剧,对大企业而言,大数据的兴起部分是因为计算能力可用更低的成本获得,且各类系统如今已能够执行多任务处理。其次,内存的成本也在直线下降,企业可以在内存中处理比以往更多的数据,还有就是把计算机聚合成服务器集群越来越简单,把那些具有潜在价值,可以给商业带来巨大利润。

网上的数据充斥着大量的无用数据以及不安全数据,在通过大数据平台对全网公开数据进行抓取过程中,极易将无用数据以及不安全数据抓取并存储,虽然现有的大数据平台均安装有防火墙对数据进行过滤隔离,但是,具有长期潜伏的不安全数据却没有多大的效果,严重影响了数据安全。

发明内容

本发明的目的在于提供一种基于人工智能的大数据采集存储系统及方法,以解决上述背景技术中提出的网上的数据充斥着大量的无用数据以及不安全数据,在通过大数据平台对全网公开数据进行抓取过程中,极易将无用数据以及不安全数据抓取并存储,虽然现有的大数据平台均安装有防火墙对数据进行过滤隔离,但是,具有长期潜伏的不安全数据却没有多大的效果,严重影响了数据安全的问题。

为实现上述目的,本发明提供如下技术方案:一种基于人工智能的大数据采集存储系统,该基于人工智能的大数据采集存储系统包括:

抓取系统,通过所述抓取系统对全网的公开数据进行抓取;

防火墙系统,所述防火墙的输入端链接到所述抓取系统的输出端上,通过所述抓取系统将抓取的公开数据输入到所述防火墙上;

临时存储系统,所述临时存储系统的输入端链接到所述防火墙系统的输出端上,经过所述防火墙系统的数据输入到所述临时存储系统内进行临时存储;

存储系统,所述存储系统的输入端链接到所述临时存储系统的输出端上,经过所述临时存储的数据输入到所述存储系统内进行存储。

优选的,所述防火墙系统为市面上常见的防火墙系统。

优选的,所述临时存储系统的存储时间为1-2周。

优选的,所述存储系统为分布式存储系统。

一种基于人工智能的大数据采集存储系统的使用方法,该基于人工智能的大数据采集存储系统的使用方法包括如下步骤:

S1:通过所述抓取系统对全网的公开数据进行抓取;

S2:是防火墙系统设置在所述抓取系统的输出端,通过所述防火墙系统对抓取的数据进行过滤处理,筛除不安全数据和无用数据;

S3:经过所述防火墙筛除的数据进入到所述临时存储系统内,数据在所述临时存储系统内进行临时存储,进行隔离观察,对突破所述防火墙的不安全系统以及无用系统进行清查;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门物之联智能科技有限公司,未经厦门物之联智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011293708.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top