[发明专利]数据处理方法及装置、数据查询方法及装置、网络设备在审
申请号: | 201910535480.4 | 申请日: | 2019-06-19 |
公开(公告)号: | CN112115164A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 罗艳军 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/22 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘亚飞 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 数据 查询 网络设备 | ||
本发明提供了一种数据处理方法及装置、数据查询方法及装置、网络设备,该数据处理方法包括:采集待处理的原始数据;对原始数据按照指定格式进行结构化处理,得到结构化数据;对结构化数据进行聚合处理以得到聚合数据,将聚合数据作为原始数据处理后的数据;其中,聚合数据的数据量小于原始数据的数据量。本发明能够有效缩减数据量,改善现有技术中数据量庞大的问题。
技术领域
本发明涉及数据处理技术领域,尤其是涉及数据处理方法及装置、数据查询方法及装置、网络设备。
背景技术
在诸如云服务等领域中通常会涉及到庞大的数据量。诸如,云服务提供商会为用户提供计算服务、网络服务、存储服务等多种计费产品(又可称为资源),并以数据形式记录用户在预设时间段内所消耗的资源量,得到用于作为收费依据的资源消耗数据。云服务提供商所记录得到的资源消耗数据量通常巨大。诸如,对于一个资源而言,如果云服务提供商以1秒一次的频率记录一条资源消耗数据,一天将会记录86400条数据,如果云服务提供商可提供一万个资源,一天记录的资源消耗数据则是8亿,更何况云服务提供商通常可提供几万、几十万甚至百万的资源。庞大的数据量可能会带来存储不便、查询耗时长等诸多问题。
发明内容
有鉴于此,本发明的目的在于提供一种数据处理方法及装置、数据查询方法及装置、网络设备,能够有效缩减数据量,改善现有技术中数据量庞大的问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种数据处理方法,包括:采集待处理的原始数据;对所述原始数据按照指定格式进行结构化处理,得到结构化数据;对所述结构化数据进行聚合处理以得到聚合数据,将所述聚合数据作为所述原始数据处理后的数据;其中,所述聚合数据的数据量小于所述原始数据的数据量。
在一些实施例中,所述对所述原始数据按照指定格式进行结构化处理,得到结构化数据的步骤,包括:从所述原始数据中查找与预设结构化表中的各字段对应的数据,并将查找到的所述数据填写在所述预设结构化表中对应的字段处;将经填写的所述预设结构化表作为结构化数据。
在一些实施例中,所述方法还包括:如果从所述原始数据中未查找到与所述预设结构化表中指定的关键字段对应的数据,丢弃所述原始数据。
在一些实施例中,所述对所述结构化数据进行聚合处理,得到聚合数据的步骤,包括:将所述结构化数据进行分组,得到至少一个数据组;其中,同一个所述数据组中的多条结构化数据在预设字段对应填入的数据相同;对于每个所述数据组,将该数据组中的多条结构化数据进行聚合,得到该数据组对应的聚合数据;其中,所述聚合数据为该数据组中的多条结构化数据中选取的一条结构化数据,或者,所述聚合数据为该数据组中的多条结构化数据按照预设算法形成的一条新的结构化数据。
在一些实施例中,所述方法还包括:将得到的所述聚合数据存储于非关系型数据库中;所述非关系型数据库部署于服务器集群上。
在一些实施例中,所述采集待处理的原始数据的步骤,包括:按照预设频率从部署有计费产品的服务器获取待处理的原始数据;其中,所述原始数据为所述服务器记录的所述计费产品的资源消耗数据;所述服务器的数量为一个或多个。
第二方面,本发明实施例还提供一种数据查询方法,包括:如果接收到数据查询请求,从预设的数据库中查找与所述数据查询请求对应的聚合数据;其中,所述数据库中存储有如第一方面任一项实施例提供的所述的数据处理方法得到的聚合数据;将查找到的所述聚合数据反馈给所述数据查询请求的请求方。
第三方面,本发明实施例提供了一种数据处理装置,包括:数据采集模块,用于采集待处理的原始数据;数据结构化模块,用于对所述原始数据按照指定格式进行结构化处理,得到结构化数据;数据聚合模块,用于对所述结构化数据进行聚合处理以得到聚合数据,将所述聚合数据作为所述原始数据处理后的数据;其中,所述聚合数据的数据量小于所述原始数据的数据量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910535480.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置