[发明专利]用户画像构建方法有效
申请号: | 201510965619.0 | 申请日: | 2015-12-22 |
公开(公告)号: | CN105608171B | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 孙东;杨彬;李言芹;吕晓华 | 申请(专利权)人: | 青岛海贝易通信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 青岛中天汇智知识产权代理有限公司 37241 | 代理人: | 郝团代 |
地址: | 266101 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 构建 方法 | ||
1.一种用户画像的构建方法,其特征在于,包括如下步骤:
步骤S1:建立知识库:获取互联网各类数据,并将获取的互联网数据进行融合打通形成知识库,将互联网数据融合打通时,首先对互联网数据细化类别,然后进行标签自动归并,将类别进行统一;
步骤S2:获取用户的上网日志;
步骤S3:构建用户基础标签:将上述上网日志与所述知识库进行匹配形成用户基础标签;
步骤S4:构建用户属性标签:结合电信运营商的CRM数据及地理位置数据构建用户属性标签;
步骤S5:计算标签数据:对上述基础标签和属性标签进行标签的权重及衰减因子处理:
对标签进行权重处理时,总的标签权重采用如下公式计算:W=触媒权重*行为权重*访问频度,所述触媒权重指不同网站其区分用户特征的重要性,行为权重指的是用户不同行为对于区分用户意向的重要性;
对标签进行衰减因子处理时,采用如下衰减函数公式计算:Wts=W*exp(-k(d-ds)),其中,W为总的标签权重,k代表遗忘速率,d-ds指用户行为发生时间到当前时间的时间跨度;步骤S6:生成用户画像。
2.根据权利要求1所述的用户画像的构建方法,其特征在于,所述步骤S6中,还可以针对行业用户要求,结合行业用户及行业客户数据进行个性化数据挖掘,构建符合行业应用的用户画像。
3.根据权利要求2所述的用户画像的构建方法,其特征在于,所述步骤S1中,获取互联网各类数据时采用分布式爬虫爬取方式,所述分布式爬虫采用主从模式部署。
4.根据权利要求3所述的用户画像的构建方法,其特征在于,所述基础标签包括媒体标签、购买标签、搜索标签、行业标签。
5.根据权利要求4所述的用户画像的构建方法,其特征在于,所述属性标签包括用户性别、年龄段、机型、活跃地理位置、套餐资费。
6.根据权利要求5所述的用户画像的构建方法,其特征在于,所述互联网数据包括门户网站、视频网站、电商网站、旅游网站、论坛、微博、微信。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海贝易通信息技术有限公司,未经青岛海贝易通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510965619.0/1.html,转载请声明来源钻瓜专利网。