[发明专利]一种云计算数据自动分类统计的方法和系统在审
| 申请号: | 201410382816.5 | 申请日: | 2014-08-06 | 
| 公开(公告)号: | CN104133907A | 公开(公告)日: | 2014-11-05 | 
| 发明(设计)人: | 康暖 | 申请(专利权)人: | 汉柏科技有限公司 | 
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 | 
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 谢磊 | 
| 地址: | 300384 天津市西青*** | 国省代码: | 天津;12 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 计算 数据 自动 分类 统计 方法 系统 | ||
技术领域
本发明涉及云计算领域,具体地涉及一种云计算数据自动分类统计的方法和系统。
背景技术
当前云计算存储的应用方向为大数据存储方向,其中,数据存储的最大用处就是对大数据进行分析,辅助云计算环境下的运营决策。在当前数据大爆炸的时代,如何对云计算上拥有的海量数据进行快速和实时的提取,显得十分重要。分类技术研究是云计算环境下数据分析与管理的重要研究领域。当前数据分析都采用分类整理的方式,即首先对数据进行收集,然后人工划分数据类型对数据进行整理。上述分类整理的数据分析方式,虽然被广泛采用,但是存在如下几个问题:
1、收集后再进行整理,数据量积累过多,会导致数据计算和分析时间过长,用户体验不佳;
2、人工划分数据类型,会导致数据分类不够精确,只能在固定的范围内粗略的估计。
因此急需一种数据实时发送、实时分析、实时统计的数据分类统计的方法,当有新数据类型出现时,可以自动添加数据种类,且无需用户等待数据统计结果。
发明内容
鉴于上述的技术问题,本发明的目的是提供一种能对数据实时发送、实时分析、实时统计的云计算数据自动分类统计的方法,当有新数据类型出现时,可以自动添加数据种类,且无需用户等待数据统计结果。
为达到上述目的,本发明的技术方案是:
一种云计算数据自动分类统计的方法,所述方法包括以下步骤:
云存储设备接收数据,分析数据的注册信息;
云存储设备向数据统计中心发送所述数据及所述数据的注册信息;
数据统计中心接收所述数据及注册信息,并根据所述注册信息对所述数据进行分类;
数据统计中心将分类后的数据传回云存储设备进行分类存储;其中,所述注册信息至少包括数据类型、关键字和数据大小。
进一步的,所述根据所述注册信息对所述数据进行分类的步骤进一步包括根据所述注册信息对所述数据按多级分类法进行分类。
进一步的,所述多级分类法包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。
进一步的,所述多级分类法进一步包括:当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。
进一步的,所述次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类的步骤进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
进一步的,所述方法进一步包括:云存储设备将分类存储的数据进行分类输出。
本发明还提供了一种云计算数据自动分类统计的系统,所述系统包括:
云存储设备,用于接收数据,并分析数据的注册信息;还用于向数据统计中心发送所述数据及所述数据的注册信息;
数据统计中心,用于接收云存储设备所发送的所述数据及注册信息,并根据所述注册信息对所述数据进行分类;并用于将分类后的数据传回云存储设备进行分类存储;
其中,所述注册信息至少包括数据类型、关键字和数据大小。
进一步的,所述数据统计中心,还执行下述操作:根据所述注册信息对所述数据按多级分类法进行分类。
进一步的,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,包括:首级分类按数据的类型进行分类;其中,所述数据的类型为文本类型、图片类型、压缩类型、语音类型和视频类型。
进一步的,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,进一步包括:当首级分类按文本类型进行分类时,次级分类按数据的关键字进行分类;当首级分类按图片类型进行分类时,次级分类按图片大小和/或应用分类;当首级分类按压缩类型进行分类时,次级分类首先对压缩文件内容进行扫描,后按压缩文件中包含的数据类型进行分类;当首级分类按语音类型或视频类型分类时,次级分类按语音类型或视频类型所统计的使用者计数进行分类。
进一步的,所述数据统计中心根据所述注册信息对所述数据按多级分类法进行分类,进一步包括:对压缩文件按压缩文件内容为文本类型、图片类型、语音类型、或视频类型进行三级分类。
进一步的,所述云存储设备将分类存储的数据进行分类输出。。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉柏科技有限公司,未经汉柏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410382816.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高炉布料过程径向矿焦比的控制方法
 - 下一篇:一种分类分组方法
 
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
 - 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
 - 数据发送方法、数据发送系统、数据发送装置以及数据结构
 - 数据显示系统、数据中继设备、数据中继方法及数据系统
 - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
 - 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
 - 数据发送和数据接收设备、数据发送和数据接收方法
 - 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 





