[发明专利]一种多数据的处理方法、系统及存储介质有效
申请号: | 201711453588.6 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108133026B | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 陈亮;何庆勇 | 申请(专利权)人: | 深圳索信达数据技术有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/174;G06F16/25;G06F11/10 |
代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多数 处理 方法 系统 存储 介质 | ||
本发明公开了一种多数据的处理方法,其包括如下步骤:接收来自外部的数据请求指令;根据数据请求指令调取原始数据压缩包和与原始数据对应的接口校验文件;提取接口校验文件的MD5,并作为第一特征值;解压缩原始数据压缩包,并得到原始数据;提取原始数据的接口数据文件,获得待校验接口数据文件;提取待校验接口数据文件的MD5,并作为第二特征值;判断第一特征值与第二特征值是否匹配;若第一特征值与第二特征值匹配,则发送原始数据至发送数据请求指令的请求终端。本发明通过校验原始数据的接口数据文件,并对已提取的数据进行备份,防止错误数据流出导致数据失窃,保证了数据的正确性和安全性。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种多数据的处理方法、系统及存储介质。
背景技术
随着大数据技术的发展,数据采集、转换和传输等流处理技术比以往显得更加重要,并对其在应对复杂性与适配性方面提出了更高的要求。目前有必要研究结构化与非结构化数据多类型数据源与数据处理技术,提高数据流处理效率和安全,更好地支撑大数据技术的应用。
目前技术对多数据源和多类型数据的兼容性和灵活性不高,需要采用不同的技术和工具来实现,而且在进行大数据的抽取时容易抽取出错误的、不匹配的数据,导致抽取出的数据并非用户所需求的数据,同时还会泄露错误的数据中的信息,同时造成了信息的不安全。
发明内容
本发明所要解决的技术问题是提供一种多数据的处理方法、系统及存储介质,以解决现有技术中抽取出的数据并非用户所需求的数据,造成了信息不安全的问题。
为了解决上述问题,本发明提供了一种多数据的处理方法,其包括如下步骤:
接收来自外部的数据请求指令;
根据所述数据请求指令调取原始数据压缩包和与所述原始数据对应的接口校验文件;
提取所述接口校验文件的MD5,并作为第一特征值;
解压缩所述原始数据压缩包,并得到原始数据;
抽取所述原始数据的接口数据文件,获得待校验接口数据文件;
提取所述待校验接口数据文件的MD5,并作为第二特征值;
判断所述第一特征值与所述第二特征值是否匹配;
若所述第一特征值与所述第二特征值匹配,则发送所述原始数据至发送所述数据请求指令的请求终端。
作为本发明的进一步改进,所述判断所述第一特征值与所述第二特征值是否匹配,之后还包括:
若所述第一特征值与所述第二特征值不匹配,则标记所述原始数据压缩包为非原装数据压缩包;
根据所述非原装数据压缩包生成记录文件;
发送所述记录文件至发送所述数据请求指令的请求终端。
作为本发明的进一步改进,根据所述数据请求指令调取原始数据压缩包和与所述原始数据对应的接口校验文件,之后包括:
判断所述原始数据压缩包是否标记为非原装数据压缩包;
若所述原始数据压缩包被标记为非原装数据压缩包,则发送与所述原始数据压缩包对应的记录文件至发送所述数据请求指令的请求终端。
作为本发明的进一步改进,其还包括:
保存所述接口校验文件和所述待验证接口数据文件,并记录保存时长;
当所述保存时长达到预设时长时,删除所述接口校验文件和所述待验证接口数据文件。
本发明还提供了一种多数据的处理系统,其应用于多数据的处理方法,其包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳索信达数据技术有限公司,未经深圳索信达数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711453588.6/2.html,转载请声明来源钻瓜专利网。