[发明专利]数据存储方法和装置在审
申请号: | 201410459122.7 | 申请日: | 2014-09-10 |
公开(公告)号: | CN104199945A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | 池雷 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 李志刚;吴贵明 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 存储 方法 装置 | ||
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据存储方法和装置。
背景技术
在对互联网的海量数据进行统计分析时,需要将一段时间内的存储为历史数据统计数据(例如将1天内的数据累加存储),以便于根据汇总数据快速生成报表,避免对原始海量数据的搜索,这种方式广泛应用于大数据分析中。
现有技术进行数据存储时,通常采用两种方案:一种方案是将历史数据存为多块,一旦有延期录入的历史数据作为新进数据进行录入,则单独存储延期录入的历史数据为块,并关联延期录入的历史数据与同期的历史数据。另外一种方案是删除所有统计数据,根据所有历史数据和新录入的数据重新将历史数据进行统计汇总。
第一种方案明显的缺陷是多记录了一条记录,造成了存储空间浪费。另外,对于不能直接加和的数据,在两个块内记录同期的数据会造成存储的数据重复,从而导致统计的数据结果不准确。
第二种方案由于新进数据访问日期可能包含任何一天或多天的数据,所以需要将所有数据合并汇总历史数据统计值,虽然能够解决方案1正确性的问题,但由于不确定新进数据的影响范围,需要全部重新计算,耗费大量的计算资源。
针对现有技术中为了保证数据的准确统计而导致的系统开销比较大的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种数据存储方法和装置,以解决为了保证数据的准确存储而导致的系统开销比较大的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种数据存储方法。根据本发明的数据存储方法包括:获取待统计数据的时间标识;按照所述时间标识将所述待统计数据存储在数据库的不同分区中,其中,每个所述分区对应一个所述时间标识;对存储有所述待统计数据的所述分区中的数据进行统计,得到统计结果;以及输出所述统计结果。
进一步地,按照所述时间标识将所述待统计数据存储在数据库的不同分区中包括:根据所述时间标识判断所述待统计数据为新进数据或者延期数据,其中,所述新进数据为所述待统计数据的时间标识与所述数据库中已经存储的时间标识不同的数据,所述延期数据为所述待统计数据的时间标识与所述数据库中已经存储的时间标识相同的数据;如果所述待统计数据为所述延期数据,则在所述数据库中查找与所述延期数据的所述时间标识相同的第一分区,并将所述延期数据存储在所述第一分区中;如果所述待统计数据为所述新进数据,则按照所述新进数据的所述时间标识建立第二分区,并将所述新进数据存储在所述第二分区中。
进一步地,对存储有所述待统计数据的所述分区中的数据进行统计,得到统计结果包括:对存储在所述第一分区中的同期数据和所述延期数据进行统计,得到第一统计结果,其中,所述同期数据为与所述延期数据的时间标识相同的数据;或者对存储在所述第二分区中的所述新进数据进行统计,得到第二统计结果。
进一步地,在获取待统计数据的时间标识之前,所述方法还包括:获取所述数据库中存储数据的索引标识,其中,所述索引标识为按照所述数据库中的数据产生顺序生成的数值;按照所述索引标识从所述数据库的历史数据中查找所述数值最大的所述索引标识,得到历史数据的最大索引标识;获取所述待统计数据的索引标识中所述数值最大的索引标识,得到所述待统计数据的最大索引标识;以及将处于所述历史数据的最大索引标识与所述待统计数据的最大索引标识之间的索引标识对应的数据作为所述待统计数据。
进一步地,获取待统计数据的时间标识包括:按照所述索引标识查找处于所述历史数据的最大索引标识与所述待统计数据的最大索引标识之间的索引标识对应的数据的时间标识;将查找到的时间标识作为所述待统计数据的所述时间标识。
为了实现上述目的,根据本发明的另一方面,提供了一种数据存储装置。根据本发明的数据存储装置包括:第一获取单元,用于获取待统计数据的时间标识;存储单元,用于按照所述时间标识将所述待统计数据存储在数据库的不同分区中,其中,每个所述分区对应一个所述时间标识;统计单元,用于对存储有所述待统计数据的所述分区中的数据进行统计,得到统计结果;以及输出单元,用于输出所述统计结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司;,未经北京国双科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410459122.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网页数据更新处理方法及装置
- 下一篇:一种待推荐节点线路的确定方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置