[发明专利]一种温数据存储方法在审

专利信息
申请号: 201911102664.8 申请日: 2019-11-12
公开(公告)号: CN111026721A 公开(公告)日: 2020-04-17
发明(设计)人: 冯报安;杨晶生 申请(专利权)人: 上海麦克风文化传媒有限公司
主分类号: G06F16/172 分类号: G06F16/172;G06F16/182;G06F16/14
代理公司: 上海九泽律师事务所 31337 代理人: 周云;卢双双
地址: 200030 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 存储 方法
【说明书】:

发明属于温数据存储领域,尤其时涉及一种温数据存储方法,包括:每日通过服务器以及相关平台录入数据;根据录入数据时的日期对数据赋值n;对当日日期进行赋值,设置成m,通过算法算出(m‑n)的值,即为数据关联的关键词,将关键词关联数据;设置阈值a;将数据关联的关键词(m‑n)与阈值a进行大小比较,当出现(m‑n)较大时,对数据进行清除处理,当出现a较大时,不对数据进行处理;通过Spark从HDFS通过不同的查询条件读取大规模的数据进行分析计算。本发明使用Parquet格式和Snappy压缩算法在提升大范围数据的读取速度的同时,能够减少住数据存储的用量。

技术领域

本发明涉及温数据存储领域,尤其涉及一种温数据存储方法。

背景技术

当前架构的存储方案下,是将全部数据存储在单一的数据库中,然而传统的数据库为了满足一些特定的需求,比如:强一致性,事务性,大数据量下的高性能读写等等,往往对于大范围大批量的分析处理无法得到很好的优化,从而导致数据库会需要进行全表扫描的操作,从而耗费大量的时间。

另外根据业务场景,大部分的离线分析计算不会需要使用到全部的数据量,往往时间跨度在半年至一年之间,所以只保存需要范围内的数据,也可以提升分析计算的效率并且控制硬件的使用成本。

为此,我们提出一种温数据存储方法来解决上述问题。

发明内容

1、发明目的。

本发明提出了一种温数据存储方法,可以定期对数据进行清理,同时便于对数据进行索引和分组,对于硬件的需求较低。

2、本发明所采用的技术方案。

一种温数据存储方法,具体包括以下步骤:

S1、每日通过服务器以及相关平台录入数据;

S2、根据录入数据时的日期对数据赋值n;

S3、将数据以Parquet格式存入HDFS;

S4、对当日日期进行赋值,设置成m,通过算法算出(m-n)的值,即为数据关联的关键词,将关键词关联数据;

S5、设置阈值a;

S6、将数据关联的关键词(m-n)与阈值a进行大小比较,当出现(m-n)较大时,对数据进行清除处理,当出现a较大时,不对数据进行处理;

S7、通过Spark从HDFS通过不同的查询条件读取大规模的数据进行分析计算。

在上述的一种温数据存储方法中,在进行所述S1步骤前先对数据进行检测,检测数据中是否有与现有数据相重复的,检测到重复的数据不予录入。

在上述的一种温数据存储方法中,在检测到重复数据后,根据当日的日期重新对存储中的现有数据进行m的赋值。

在上述的一种温数据存储方法中,在进行所述S8步骤时,根据数据的索引次数得出数据的得分值,将数据的得分值进行加权处理,得到每个物品排序权重值,根据权重值对数据进行分组。

3、本发明所产生的技术效果。

通过将开源的集群运算框架Spark和开源的面向列的格式Parquet进行配合,再将数据以一定的方式进行索引分组,让大范围的数据读取的性能得到大幅度的提升;与此同时,数据只保存业务需求的时间长度,如半年,那么数据规模相对适中,所以使用价格和性能都相对适中的混合硬盘进行存储,从而控制成本。

附图说明

图1为本发明提出的一种温数据存储方法的步骤图。

具体实施方式

以下实施例仅处于说明性目的,而不是想要限制本发明的范围。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海麦克风文化传媒有限公司,未经上海麦克风文化传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911102664.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top