[发明专利]一种基于WEB分析的分布式处理方法和系统无效

专利信息
申请号: 200910158340.6 申请日: 2009-07-07
公开(公告)号: CN101582090A 公开(公告)日: 2009-11-18
发明(设计)人: 李存刚;鲁雪林;张渔;冯帅;崇晓云 申请(专利权)人: 北京黑米世纪信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06Q30/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 100022北京市朝阳区西*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 web 分析 分布式 处理 方法 系统
【说明书】:

技术领域

发明涉及互联网WEB分析相关领域。

背景技术

随着互联网的发展,WEB分析已经成为企业了解、优化在线业务的重要 手段。而在WEB分析领域,需要处理的数据量级是非常庞大的,如何对这些 海量的在线业务数据进行高效地并行处理,以实时或准实时(一般可延迟一 天,即:今天显示昨日的各纬度分析数据)的方式呈现给顾客,并通过增加 服务器就可以进行任意扩容,是众多WEB分析工具提供商需要解决的难题。

目前市场上的WEB分析工具在这种海量的数据面前缺乏有效的方法,在 高效性、可靠性、扩展性和可管理性等方面都有所欠缺。

发明内容

为了解决上述存在的问题,本发明公开了一种基于WEB分析的分布式处 理方法和系统,包括:数据农场、数据加工厂、分布式数据仓库和数据呈现 中心四个工作模块。本发明的核心思想是:

(1)数据农场从多种数据源采集顾客数据;

(2)将这些海量的顾客原始数据并行写入分布式数据仓库中;

(3)数据加工厂从分布式数据仓库中读出顾客原始数据,进行并行计算 和二次处理;

(4)二次处理后的结果数据回写到分布式数据仓库中;

(5)数据呈现中心利用并行查询技术,让使用者方便地通过WEB查看 原始数据和二次处理后的数据。

上述顾客数据包括定量数据、定性数据和商业数据。其中,定量数据是指 顾客在网络上(尤其是WEB上)的匿名来访行为,包括但不限于顾客的匿名 特征(如:Cookie标识、IP地址、来源地域、来源运营商、来源媒体等)、访 问行为(如:浏览动作、访问过程、访问内容、点击动作、行为轨迹、网上 客服咨询行为)等;定性数据是顾客在现实社会中的属性与特征数据,包括 性别、年龄、职业、上网时间特征、上网访问内容习惯等;商业数据是指顾 客商业行为,包括顾客在WEB上所有详细的消费行为属性和购物记录。

本发明可以针对海量的WEB营销数据进行高效处理,在高效性、可靠性、 扩展性和可管理性等方面都有所突破,可应用于互联网WEB分析等领域。

本发明填补了WEB分析等领域的一项空白。

具体实施方式

本发明采用的技术方案是:在WEB分析的采集、存储、计算、呈现等环 节,采用了一种基于WEB分析的分布式处理方法和系统,该系统包括数据农 场、数据加工厂、分布式数据仓库和数据呈现中心四大工作模块。

具体工作流程如下:

(1)首先,数据农场从多种数据源中收割、采集顾客数据;

(2)然后,数据农场将这些海量的顾客原始数据并行写入分布式数据仓 库中。分布式数据仓库中包括多个存储节点,这些节点分工协作,共同分布 式存储这些顾客原始数据;

(3)数据加工厂从分布式数据仓库中读出这些顾客原始数据,进行二次 处理;

(4)数据加工厂将二次处理后的结果数据回写到分布式数据仓库中。分 布式数据仓库的多个存储节点分工协作,共同分布式存储这些二次处理后的 顾客数据;

(5)数据呈现中心利用并行查询技术,让使用者方便地通过WEB查看 原始数据和二次处理后的数据。

优选地,所述顾客数据包括定量数据、定性数据和商业数据。

优选地,所述采集顾客数据的方式为并行地从多个数据源中采集。

优选地,所述数据农场的数据采集过程是由多个并行工作的队列节点完成 的;

优选地,所述数据采集环节上,应用消息队列技术,确保在数据源有超大 的突发流量时仍然能够很均匀地操作数据库,确保顾客数据不会丢失,系统 也不会崩溃。

优选地,所述数据农场是将顾客数据写入分布式数据仓库中;

优选地,所述分布式数据仓库是由多个分布式的存储节点构成,每个存储 节点内安装一套数据库。分布式数据仓库在外部看来就是一个数据库;

优选地,所述数据加工厂是将分布式数据仓库中的顾客数据进行二次处 理,并将处理过的结果数据写回到分布式数据仓库中;

优选地,所述数据加工厂的二次处理过程是由多个并行工作的计算节点共 同完成的;

优选地,所述数据呈现中心是将分布式数据仓库中的原始顾客数据和二次 处理后的顾客数据通过WEB方式呈现出来;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京黑米世纪信息技术有限公司,未经北京黑米世纪信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910158340.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top