[发明专利]用户画像构建方法有效
申请号: | 201510965619.0 | 申请日: | 2015-12-22 |
公开(公告)号: | CN105608171B | 公开(公告)日: | 2018-12-11 |
发明(设计)人: | 孙东;杨彬;李言芹;吕晓华 | 申请(专利权)人: | 青岛海贝易通信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 青岛中天汇智知识产权代理有限公司 37241 | 代理人: | 郝团代 |
地址: | 266101 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 构建 方法 | ||
本发明提出一种用户画像构建方法,首先通过分布式爬虫爬取互联网各类数据并融合打通形成海量知识库;然后获取的上网日志并将上网日志与知识库进行匹配生成用户基础标签;结合电信运营商特有的客户关系管理(CRM)数据及地理位置数据构建用户属性标签;对标签数据进行权重及衰减因子处理生成用户基础画像,并且可以结合行业用户的特征及行业客户数据做个性化的数据挖掘,生成符合行业应用的用户画像并对外提供服务。本发明的优点在于能够为客户提供精确的全网用户画像,充分利用互联网数据,为用户分析、产品推荐、精准营销等应用服务提供方便。
技术领域
本发明涉及通信技术领域,具体涉及一种用户画像构建方法。
背景技术
用户画像,是一种用于勾画目标用户、联系用户诉求与设计方向的有效工具,其在各领域均得到了广泛的应用。例如,具体实现时,可以将用户画像作为用于刻画用户特征的标签(tag) 集合,比如,包括年龄、性别等静态属性,也包括用户的兴趣特征,如旅游、服饰等。用户画像的构建和更新对于后续的信息的定向传播,比如广告的定向投放有着重要的意义。
目前的互联网行业中,构建用户画像的方法一般是根据用户在站内的行为,如将访问的媒体类目、商品类目等行为日志保存下来,然后,在一定时间窗口内,遍历所有的用户行为日志,按照某种权重衰减函数对其进行计算,得到当前最新的用户画像。该方式存在的问题是获取的数据非常片面,仅有该站内的用户数据,对于用户在其他网站上的访问行为则一无所知;同时,对于互联网行业来说,难以做到用户实名注册,所以对于年龄、性别等用户静态属性只能通过相关统计算法进行猜测,可靠性不高。
并且,目前各方数据持有者的用户数据基本都是封闭的,未能在全网层面打通共享各数据孤岛。这就对数据使用者造成无法在全网范围内准确了解用户的行为偏好、并结合其行业需求对数据进行个性化的数据挖掘,对生成符合行业应用的用户画像造成一定困难。
发明内容
本发明的目的是针对上述构建用户画像时,数据片段化、数据封闭等原因造成用户画像不够精准等技术问题提出的一种用户画像构建方法。通过建立精确的全网统一用户画像,方便客户进行用户分析、产品推荐、精准营销等应用服务。
为了达到上述目的,本发明提出一种用户画像构建方法,包括如下步骤:
步骤S1:建立知识库:获取互联网各类数据,并将获取的互联网数据进行融合打通形成知识库;
步骤S2:获取用户的上网日志;
步骤S3:构建用户基础标签:将上述上网日志与所述知识库进行匹配形成用户基础标签;
步骤S4:构建用户属性标签:结合电信运营商的CRM数据及地理位置数据构建用户属性标签;
步骤S5:计算标签数据:对上述基础标签和属性标签进行标签的权重及衰减因子处理;
步骤S6:根据上述标签数据生成用户画像。
进一步的,所述步骤S6中,还可以针对行业用户要求,结合行业用户及行业客户数据进行个性化数据挖掘,构建符合行业应用的用户画像。
进一步的,所述步骤S1中,获取互联网各类数据时采用分布式爬虫爬取方式,所述分布式爬虫采用主从模式部署。主控节点将用户设置的URL抓取任务分发到各爬虫节点,爬虫节点负责具体的网页下载解析任务。
进一步的,所述步骤S1中,将互联网数据融合打通时,首先对互联网数据细化类别,然后进行标签自动归并,将类别进行统一。
进一步的,所述步骤S5中,对标签进行权重处理时,总的标签权重采用如下公式计算:W=触媒权重*行为权重*访问频度,所述触媒权重指不同网站其区分用户特征的重要性,行为权重指的是用户不同行为对于区分用户意向的重要性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛海贝易通信息技术有限公司,未经青岛海贝易通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510965619.0/2.html,转载请声明来源钻瓜专利网。