[发明专利]一种获取用户独立访问数的方法与装置有效
| 申请号: | 201110269194.1 | 申请日: | 2011-09-13 |
| 公开(公告)号: | CN102999506A | 公开(公告)日: | 2013-03-27 |
| 发明(设计)人: | 刘凡;吕春建 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 获取 用户 独立 访问 方法 装置 | ||
1.一种获取用户独立访问数的方法,其特征在于,包括:
打标签步骤,遍历一次用户日志,并以用户id为基准,对各维度下的每条数据打上所属维度的全局标签;
第一分析运算步骤,以标签、维度组合和用户id作为关键词,对所述数据进行聚合汇总得到用户粒度数据;
第二分析运算步骤,遍历所得到的用户粒度数据,再以标签和维度组合作为关键词,对用户粒度数据进行聚合汇总得到各维度下每个子维度的用户独立访问数。
2.如权利要求1所述的获取用户独立访问数的方法,其特征在于:
所述的打标签步骤具体包括:
数据获取步骤,遍历一次用户日志,获得用户数据;
数据复制步骤,当维度组合个数为n时,将每条数据复制n-1条;
数据保留置空步骤,对所得到由同一条用户数据复制得到的n个相同的数据分别不重复地保留一个维度的数据和对应的用户id,并将其他n-1个维度的数据置空;
标记模块步骤,将所得到的每条只保留某维度数据和对应用户id的数据打上所属维度的全局标签。
3.如权利要求1所述的获取用户独立访问数的方法,其特征在于:
所述的第一分析运算步骤具体包括:
第一判断步骤,对打上同一全局标签的每条保留一个维度数据和相应用户id的数据,判断此全局标签下是否含有相同子维度和用户id的数据;如果包含转入第一计数步骤;如果不包含,转入第二计数步骤;其中,所述第一计数步骤为,对所述数据去重并只保留一条此类数据,记录独立访问数为1;所述第二计数步骤为,根据所述数据直接记录用户独立访问数为1;
第一整理步骤,对数据进行整理得到用户粒度数据。
4.如权利要求1所述的获取用户独立访问数的方法,其特征在于:
所述的第二分析运算步骤具体包括:
第二判断步骤,遍历用户粒度数据,去除用户id,对打上同一全局标签的每条数据,判断其中是否含有相同子维度的数据;如果包含,转入第三计数步骤;如果不包含,转入第四计数步骤;其中,所述第三计数步骤为,对所述数据去重并只保留一条此类数据,并记录重复次数为用户独立访问数;所述第四计数步骤为,根据所述数据直接记录用户独立访问次数为1;
第二整理步骤,将各维度下每个子维度的用户独立访问数整理成表。
5.如权利要求1所述的获取用户独立访问数的方法,其特征在于:
还包括第三分析运算步骤,根据同一子纬度数据条数获得各子纬度的用户访问数。
6.如权利要求3或4所述的获取用户独立访问数的方法,其特征在于:
使用聚合函数进行去重操作。
7.一种获得用户独立访问数的装置,其特征在于,包括:
打标签模块,用于遍历一次用户数据,并以用户id为基准,对各维度下的每条数据打上所属维度的全局标签;
第一分析运算模块,用于以标签、维度和用户id的组合作为关键词,对所述数据进行聚合汇总得到用户粒度数据;
第二分析运算模块,用于遍历所得到的用户粒度数据,再以标签和维度的组合作为关键词,对用户粒度数据进行聚合汇总得到各维度下每个子维度的用户独立访问数。
8.如权利要求7所述的获得用户独立访问数的装置,其特征在于:
所述的打标签模块具体包括:
数据获取模块,用于遍历一次用户日志,获得用户数据;
数据复制模块,用于当维度组合个数为n时,将每条数据复制n-1条;
数据保留和置空模块,用于对所得到由同一条用户数据复制得到的n个相同的数据分别不重复地保留一个维度的数据和对应的用户id,并将其他n-1个维度的数据置空;
标记模块,用于将所得到的每条只保留某维度数据和对应用户id的数据打上所属维度的全局标签。
9.如权利要求8所述的获得用户独立访问数的装置,其特征在于:
所述的分析运算模块一具体包括:
第一判断模块,用于对打上同一全局标签的每条保留一个维度数据和相应用户id的数据,判断此全局标签下是否含有相同子维度和用户id的数据;
第一计数模块,用于对所述数据去重并只保留一条此类数据,记录独立访问数为1;
第二计数模块,用于根据所述数据直接记录用户独立访问数为1;
第一整理模块,用于对数据进行整理得到用户粒度数据。
10.如权利要求9所述的获得用户独立访问数的装置,其特征在于:
所述的分析运算模块二具体包括:
第二判断模块,用于遍历用户粒度数据,去除用户id,对打上同一全局标签的每条数据,判断其中是否含有相同子维度的数据;
第三计数模块,用于对所述数据去重并只保留一条此类数据,并记录重复次数为用户独立访问数;
第四计数模块,用于根据所述数据直接记录用户独立访问次数为1;
第二整理模块,用于将各维度下每个子维度的用户独立访问数整理成表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110269194.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种微小型飞轮控制电路
- 下一篇:面垫机





