[发明专利]一种运营数据处理方法及系统有效

专利信息
申请号: 201410032158.7 申请日: 2014-01-23
公开(公告)号: CN103761309B 公开(公告)日: 2017-04-26
发明(设计)人: 洪松;敖锦蓉;何鸿凌;舒琴;蔡柱昌;曹燕 申请(专利权)人: 中国移动(深圳)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳市顺天达专利商标代理有限公司44217 代理人: 郭伟刚
地址: 518048 广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 运营 数据处理 方法 系统
【说明书】:

技术领域

发明涉及通信领域,更具体地说,涉及一种运营数据处理方法及系统。

背景技术

现有经营分析系统一般采用单一的数据仓库提供数据处理能力,通过数据仓库提供的ETL工具进行数据的抽取、加载和转换,之后再利用数据仓库的数据分析和关联处理能力应对前端业务需求。传统数据仓库厂商的产品基于关系模型的高性能数据查询和分析,主要处理结构化数据的高性能查询和分析;成熟内建数据挖掘算法,并提供成熟的报表工具和数据访问接口,目前已经在银行、电信等具有大量数据的行业广泛使用。但随着移动互联网的迅速发展,大量由互联网产生的非结构化数据需要分析和处理,但企业级数据仓库不适合非结构化数据处理;海量数据规模下,数据仓库在大数据的存储和分析方面都显得能力不足;除此之外,传统数据仓库对于实时需求的处理能力不足,无法支持实时性应用。

面对移动互联网和大数据时代的挑战,经营分析系统的服务对象越来越广泛、业务量、数据量越来越大,经营分析系统需要对内容、音频、文本信息、视频、图片等非结构化的海量的数据信息进行有效分析,这些数据难以像用户资料、账单一样纳入数据仓库进行批量处理,传统数据仓库无法处理这些新型的业务数据,Hadoop的MapReduce的批处理方式在某些情况下也不适合处理这种类型的数据,并且在及时性和处理效率方面,传统数据仓库存在天生的缺陷。

部分企业尝试在经营分析系统中通过小批次处理(Micro-batch)的方法来解决上述处理处理效率和及时性的问题,但是这些方案都是基于原有批处理的思路解决实时处理的问题,这种过渡性的解决方案不能从本质上满足数据实时处理的需求,随着数据量的极速膨胀,这种方案有其局限性。

随着移动互联网的迅猛发展,用户数据正在以几何级数迅猛增长。由于传统数据仓库的扩展需要企业级硬件的的支持,且很难做到水平线性扩展,因此传统数据仓库的扩展能力不足,不能支撑迅猛增长的数据的存储。

现有技术中的流式计算产品并没有与经营分析系统自身特点和架构设计特点进行整合的应用案例。

发明内容

本发明要解决的技术问题在于,针对现有技术的不足,提供一种运营数据处理方法及系统。

该方法及系统提供了流式计算技术在经营分析系统的技术和架构落地实现,用于解决非结构化数据的实时业务数据、海量数据的实时分析、数据处理的效率和及时性的问题,同时解决海量数据的存储和分析问题。

本发明解决其技术问题所采用的技术方案是:提供一种运营数据处理方法。

优选地,本发明的运营数据处理方法包括以下步骤:

S1:运维管理中心(5)根据需要确定要调用的数据应用装置(4)的数据应用模块及数据获取装置(1)需要获取的数据;

S2:所述运维管理中心(5)控制所述数据获取装置(1)中的实时获取模块(11)获取实时数据,并控制数据获取装置(1)中的批量获取模块(12)批量获取非实时数据,所述数据获取装置(1)中的预处理模块(13)对获取的实时数据与非实时数据进行预处理,将所述实时数据与非实时数据进行格式标准化,并将非实时数据中的结构化数据与实时数据中的结构化数据传输到数据处理装置(2)的分布式文件系统(21)中,并根据业务需要,把所述数据获取装置(1)获取的数据中的相应数据传输到数据处理装置(2)的流式计算引擎(22)中;

S3:数据处理装置(2)中的分布式文件系统(21)对其正常运行需要的辅助软件系列进行软件系统集成,并将其获取的非实时数据中的非结构化数据进行存储,数据处理装置(2)中的数据仓库(23)将其获取的结构化数据进行存储;

S4:数据处理装置(2)中的在线数据分析模块(25)控制流式计算引擎(22)对传输到流式计算引擎(22)中的数据进行流式计算、控制数据仓库(23)对所述结构化数据中的实时营销数据进行在线数据分析,数据处理装置(2)中的离线数据分析模块(26)控制所述数据仓库(23)采用微批处理方法对其中存储的所述结构化数据中的非实时数据进行离线数据分析,控制批量计算引擎(24)采用批处理方法对所述分布式文件系统(21)存储的非实时数据中的非结构化数据进行离线数据分析;所述数据处理装置(2)将经所述流式计算引擎(22)、数据仓库(23)、批量计算引擎(24)计算后的全部数据传输到数据通信装置(3);

S5:数据通信装置(3)将经过所述数据处理装置(2)处理后的数据传输到数据应用装置(4);

S6:数据应用装置(4)的数据应用模块(41、42、43)应用接收的数据提供数据应用服务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动(深圳)有限公司,未经中国移动(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410032158.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top