[发明专利]用户行为的统计数据矩阵的生成方法和装置在审

专利信息
申请号: 201910446901.6 申请日: 2019-05-27
公开(公告)号: CN112000704A 公开(公告)日: 2020-11-27
发明(设计)人: 李慧萍 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/22
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 张一军;张效荣
地址: 100086 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户 行为 统计数据 矩阵 生成 方法 装置
【权利要求书】:

1.一种用户行为的统计数据矩阵的生成方法,其特征在于,包括:

获取预设时间间隔内多个用户针对多种物品的多条单次行为数据;其中,所述单次行为数据中包括预设的目标维度的数据;

依据所述单次行为数据确定每一用户针对每种物品的目标维度数据的统计结果,从中选取非零统计结果;其中,每一非零统计结果与其对应的物品标识形成键值对数据;

将同一用户的所述键值对数据单独存储在一个集合;在该集合中,将键值对数据中的物品标识存储在第一子集,将键值对数据中的非零统计结果存储在第二子集;其中,在第一子集与第二子集中,处于相同存储位置的数据相互对应;以及,

将每一集合中的物品标识转换为矩阵的列序号,以使每一集合成为用于组成所述统计数据矩阵的行向量;或者,将每一集合中的物品标识转换为矩阵的行序号,以使每一集合成为用于组成所述统计数据矩阵的列向量。

2.根据权利要求1所述的方法,其特征在于,

所述统计数据矩阵中的任一元素表征:在所述时间间隔内,所述多个用户中的一个用户针对所述多种物品中的一种物品所实施的行为在目标维度的统计结果;

所述统计数据矩阵中与该元素处于不同行且不同列的任一元素表征:在所述时间间隔内,所述多个用户中的另一用户针对所述多种物品中的另一种物品所实施的行为在目标维度的统计结果。

3.根据权利要求1所述的方法,其特征在于,

所述方法进一步包括:在将同一用户的所述键值对数据单独存储在一个集合之后,按照预设顺序将每一集合中的键值对数据排序;其中,所述排序使键值对数据中物品标识对应的矩阵列序号或者行序号以升序排列;

所述将键值对数据中的物品标识存储在第一子集,将键值对数据中的非零统计结果存储在第二子集,具体包括:按照所述排序后形成的键值对数据排列顺序,将键值对数据中的物品标识存储在第一子集,将键值对数据中的非零统计结果存储在第二子集。

4.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:

在使每一集合成为所述行向量或者列向量之前,确定所述多种物品的种类数量并将该数量存储在每一集合。

5.根据权利要求1-4任一所述的方法,其特征在于,

所述方法用于以Hive作为查询引擎的Spark分布式系统中,所述单次行为数据存储在Hive数据表中;

获取非零统计结果采用Spark中的以键归约算子,将同一用户的键值对数据单独存储在一个集合采用Spark中的以键组合算子;

所述行为包括以下至少一种:浏览、搜索、购买;所述目标维度包括以下至少一种:浏览次数、浏览时长、搜索次数、购买次数;

以及,第一子集和第二子集为数组,所述统计数据矩阵为稀疏矩阵。

6.一种用户行为的统计数据矩阵的生成装置,其特征在于,包括:

数据获取单元,用于获取预设时间间隔内多个用户针对多种物品的多条单次行为数据;其中,所述单次行为数据中包括预设的目标维度的数据;

统计单元,用于依据所述单次行为数据确定每一用户针对每种物品的目标维度数据的统计结果,从中选取非零统计结果;其中,每一非零统计结果与其对应的物品标识形成键值对数据;

聚合单元,用于将同一用户的所述键值对数据单独存储在一个集合;在该集合中,将键值对数据中的物品标识存储在第一子集,将键值对数据中的非零统计结果存储在第二子集;其中,在第一子集与第二子集中,处于相同存储位置的数据相互对应;以及,

矩阵生成单元,用于将每一集合中的物品标识转换为矩阵的列序号,以使每一集合成为用于组成所述统计数据矩阵的行向量;或者,将每一集合中的物品标识转换为矩阵的行序号,以使每一集合成为用于组成所述统计数据矩阵的列向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910446901.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top