[发明专利]数据统计方法和装置有效
申请号: | 201611104981.X | 申请日: | 2016-12-05 |
公开(公告)号: | CN106598494B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 金恒展;李冰 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 统计 方法 装置 | ||
1.一种数据统计方法,其特征在于,包括以下步骤:
获取待统计数据集合;
对待统计数据集合内的多条数据进行至少一次分组,得到多个目标分组,其中,每个目标分组中的数据的条数小于或者等于目标条数,所述目标条数为所述待统计数据集合的存储载体所能存储的条数上限值;
获取所述至少一次分组的分组次数,并从所述每个目标分组中统计出排序在前的第一预设条数的数据作为目标数据;
根据所述分组次数对所述每个目标分组的目标数据进行合并处理,得到合并处理后的目标数据;以及
将合并处理后的目标数据作为从所述待统计数据集合中统计出的所述条数为用户预设的目标统计数的数据。
2.如权利要求1所述的数据统计方法,其特征在于,所述对待统计数据集合内的多条数据进行至少一次分组,得到多个目标分组,包括:
将待统计数据集合内的多条数据按照条数平均进行第一次分组,得到预设个数的第一目标分组;
判断在所述第一次分组后,每个第一目标分组中的数据的条数是否小于或者等于所述目标条数;
在大于所述目标条数时,将所述每个第一目标分组中的数据按照条数平均进行第二次分组,得到与所述每个第一目标分组对应的预设个数的第二目标分组;
当在所述至少一次分组后,每个目标分组中的数据的条数小于或者等于所述目标条数时,停止对所述目标分组中的数据进行分组;
将当前分组后的多个分组中每个分组作为所述目标分组,得到多个目标分组。
3.如权利要求1所述的数据统计方法,其特征在于,在所述从所述每个目标分组中统计出排序在前的第一预设条数的数据作为目标数据之前,还包括:
根据所述分组次数和所述用户预设的目标统计数计算所述第一预设条数,其中,所述第一预设条数为所述目标统计数的倍数。
4.如权利要求1所述的数据统计方法,其特征在于,所述根据所述分组次数对所述每个目标分组的目标数据进行合并处理,包括:
将所述分组次数作为目标次数;
对属于同一个上级目标分组的多个目标分组的目标数据进行合并处理,得到与每个上级目标分组对应的上级目标数据;
逐级对所述每个目标分组的目标数据进行合并处理,得到合并处理后的目标数据。
5.如权利要求4所述的数据统计方法,其特征在于,所述对属于同一个上级目标分组的多个目标分组的目标数据进行合并处理,得到与每个上级目标分组对应的上级目标数据,包括:
从所述属于同一个上级目标分组的多个目标分组的目标数据统计出排序在前的第二预设条数的数据并作为与所述每个上级目标分组对应的上级目标数据,其中,所述第一预设条数为所述第二预设条数的倍数。
6.如权利要求1-5任一项所述的数据统计方法,其特征在于,还包括:
采用Count-min Sketch数据结构从所述每个目标分组中统计出排序在前的第一预设条数的数据作为目标数据。
7.一种数据统计装置,其特征在于,包括:
第一获取模块,用于获取待统计数据集合;
分组模块,用于对待统计数据集合内的多条数据进行至少一次分组,得到多个目标分组,其中,每个目标分组中的数据的条数小于或者等于目标条数,所述目标条数为待统计数据集合的存储载体所能存储的条数上限值;
第二获取模块,用于获取所述至少一次分组的分组次数;
统计模块,用于从所述每个目标分组中统计出排序在前的第一预设条数的数据作为目标数据;
第一处理模块,用于根据所述分组次数对所述每个目标分组的目标数据进行合并处理,得到合并处理后的目标数据;以及
第二处理模块,用于将合并处理后的目标数据作为从所述待统计数据集合中统计出的所述条数为用户预设的目标统计数的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611104981.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置