[发明专利]一种网站数据分析方法及分析系统有效

专利信息
申请号: 201210151293.4 申请日: 2012-05-15
公开(公告)号: CN103425661A 公开(公告)日: 2013-12-04
发明(设计)人: 殷霞 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 英属开曼群岛大开*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网站 数据 分析 方法 系统
【权利要求书】:

1.一种网站数据分析方法,其特征在于,包括:

通过分析网站日志数据,获得访问数据流,其中,所述访问数据流记录了访问网页的顺序;

剔除不包含重要页面的访问数据流,其中,所述重要页面为符合预定义属性的页面;

对剩余的包含重要页面的访问数据流进行频繁挖掘计算,得到出现频度高的前m个访问数据流及每个访问数据流的出现频度,m为正整数;

针对所述m个访问数据流,计算每个数据流中出现重要页面的次数,以及每个数据流的长度;

利用每个访问数据流的出现频度、出现重要页面的次数和数据流的长度,计算得出所述m个访问数据流中每个数据流的优质度。

2.根据权利要求1所述的方法,其特征在于,还包括:

对所述m个访问数据流进行优质度排名;并

依据所述优质度排名分析页面每个区块的设计。

3.根据权利要求1所述的方法,其特征在于,所述通过分析网站日志数据,获得访问数据流,包括:

通过分析网站日志数据,从所述网站日志数据中提取出访问路径;

将所述访问路径转换为树型结构,得到访问路径的树;

深度优先遍历所述访问路径的树,得到访问数据流。

4.根据权利要求1所述的方法,其特征在于,所述预定义属性的页面包括:

产生反馈行为的页面;

和/或,正在运营的活动页面。

5.根据权利要求1所述的方法,其特征在于:

所述数据流的优质度与数据流的出现频度成正比,与数据流中出现重要页面的次数成正比,与数据流的长度成反比。

6.根据权利要求5所述的方法,其特征在于,计算所述m个访问数据流中每个数据流的优质度,包括:

按照以下公式计算:

S=a0+(α·frequency(g)+β·quality(g))/γ·lenth(g);

其中,g表示一条数据流;

frequency(g)表示数据流的出现频度,α是frequency(g)的影响因子参数;

quality(g)表示数据流中出现重要页面的次数,β是quality(g)的影响因子参数;

lenth(g)表示数据流的长度,γ是lenth(g)的影响因子参数;

a0表示数据可用性参数。

7.根据权利要求1所述的方法,其特征在于:

初次取某个时间段内的网站日志数据进行数据流优质度计算;

每隔预设的时间间隔,取每次的增量日志数据进行数据流优质度计算。

8.一种网站数据分析系统,其特征在于,包括:

日志分析模块,用于通过分析网站日志数据,获得访问数据流,其中,所述访问数据流记录了访问网页的顺序;

数据剔除模块,用于剔除不包含重要页面的访问数据流,其中,所述重要页面为符合预定义属性的页面;

频繁挖掘模块,用于对剩余的包含重要页面的访问数据流进行频繁挖掘计算,得到出现频度高的前m个访问数据流及每个访问数据流的出现频度,m为正整数;

新增指标计算模块,用于针对所述m个访问数据流,计算每个数据流中出现重要页面的次数,以及每个数据流的长度;

优质度计算模块,用于利用每个访问数据流的出现频度、出现重要页面的次数和数据流的长度,计算得出所述m个访问数据流中每个数据流的优质度。

9.根据权利要求8所述的系统,其特征在于,还包括:

排序模块,用于对所述m个访问数据流进行优质度排名,并依据所述优质度排名分析页面每个区块的设计。

10.根据权利要求8所述的系统,其特征在于,所述日志分析模块包括:

提取子模块,用于通过分析网站日志数据,从所述网站日志数据中提取出访问路径;

转换子模块,用于将所述访问路径转换为树型结构,得到访问路径的树;

遍历子模块,用于深度优先遍历所述访问路径的树,得到访问数据流。

11.根据权利要求8所述的系统,其特征在于,

所述优质度计算模块按照以下公式计算:

S=a0+(α·frequency(g)+β·quality(g))/γ·lenth(g);

其中,g表示一条数据流;

frequency(g)表示数据流的出现频度,α是frequency(g)的影响因子参数;

quality(g)表示数据流中出现重要页面的次数,β是quality(g)的影响因子参数;

lenth(g)表示数据流的长度,γ是lenth(g)的影响因子参数;

a0表示数据可用性参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210151293.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top