[发明专利]用户兴趣数据分析和收集系统及其方法有效
| 申请号: | 201410823475.0 | 申请日: | 2014-12-26 |
| 公开(公告)号: | CN105589905B | 公开(公告)日: | 2019-06-18 |
| 发明(设计)人: | 冯亮;尹亚伟 | 申请(专利权)人: | 中国银联股份有限公司 |
| 主分类号: | G06F16/903 | 分类号: | G06F16/903;G06Q30/02 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 俞华梁;汤春龙 |
| 地址: | 200135 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 兴趣 数据 分析 收集 系统 及其 方法 | ||
1.一种用户兴趣数据分析和收集系统,其特征在于,所述系统包括:
会话识别模块,用于从web服务器抽取日志数据以及与所述日志数据对应的商品购买历史记录,并对所述日志数据进行处理,从而生成页面浏览序列参照集合,其中所述日志数据包括多个用户的浏览记录;
推荐服务控制器,用于实时收集第一用户的浏览记录;
日志数据预处理模块,用于在满足预定条件下,从所述推荐服务控制器接收所述第一用户在本次会话中的浏览日志数据,并对该日志数据进行预处理;以及
匹配分析模块,用于将经过预处理的日志数据与所生成的页面浏览序列参照集合进行匹配,并根据匹配结果来确定所述第一用户潜在感兴趣的商品集合,其中,所述匹配分析模块通过如下公式计算匹配度:
其中l1和l2表示两个给定序列,w1i是序列l1中的第i维的权重,w2i是序列l2中的第i维的权重,函数min返回两个数值中的较小值。
2.如权利要求1所述的系统,还包括:
候选结果过滤排序模块,用于从所述匹配分析模块接收所确定的商品集合,并根据预设定的推荐规则,对所述商品集合中的商品进行排序,并将排序的结果发送给所述推荐服务控制器。
3.如权利要求2所述的系统,其中,所述推荐服务控制器还配置成根据所述候选结果过滤排序模块所发送的排序结果,选择出最终的推荐商品并发送给所述第一用户。
4.如权利要求1所述的系统,其中,所述会话识别模块配置成执行如下步骤:
通过核对请求资源URI的后缀名,剔除请求资源为非页面的日志条目;
剔除状态响应码为错误的日志条目;
汇总同一个会话标识符的所有日志记录,形成属于该会话标识符的会话日志记录集合;以及
判断会话中是否包含购买页面和支付页面,以便筛选出最终完成购物的会话。
5.如权利要求1所述的系统,其中,当第一用户访问的页面数量超过预先设定的数目N时,所述推荐服务控制器从所述web服务器的日志中抽取该第一用户的当前会话中所有的日志条目序列,从而启动推荐服务。
6.如权利要求5所述的系统,其中,所述日志数据预处理模块配置成执行如下步骤:
从所述日志条目序列中剔除非页面的以及响应码为错误的日志条目,以便形成精化日志条目序列Lp;
根据所述精化日志条目序列Lp,产生多个预定长度的连续日志条目子序列;以及
通过如下公式将所述连续日志条目子序列中的每条子序列转换为m维的权重向量:
其中,wl,i表示某一子序列l的第i维权重,f(l,i)表示第i维日志条目的URL出现在子序列l的次数,Count(i)表示第i维URL在所述页面浏览序列参照集合中出现的次数,t(l,i)表示本次客户端浏览该页面的时间长度,λ是Count函数的权重因子。
7.如权利要求1所述的系统,其中,所述匹配分析模块进一步配置成:
根据经过预处理的日志数据与所生成的页面浏览序列参照集合的匹配结果,对于所述页面浏览序列参照集合中的每个参照浏览序列,选取其与经过预处理的日志数据中每个子序列的匹配度最大值来作为该参照浏览序列的权重;
挑选权重最大的前n个参照浏览序列,从而生成参照序列集合SeC;以及
对于所述参照序列集合SeC中每条候选参照浏览序列,找出与序列相关的购买商品集合来作为所述第一用户潜在感兴趣的商品集合。
8.如权利要求2所述的系统,其中,所述候选结果过滤排序模块配置成:
根据所述匹配分析模块所确定的商品集合,累加所述商品集合中每个商品对应的候选参照序列的权重来作为该商品的权重,
根据所述商品的权重来对所述商品集合中的商品排序,以及
将权重较大的一定数量的商品作为最终推荐商品告知所述推荐服务控制器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410823475.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





