[发明专利]长短期用户画像生成方法、装置、设备及可读存储介质在审

专利信息
申请号: 202010138562.8 申请日: 2020-03-03
公开(公告)号: CN111444158A 公开(公告)日: 2020-07-24
发明(设计)人: 于其位 申请(专利权)人: 中国平安人寿保险股份有限公司
主分类号: G06F16/182 分类号: G06F16/182;G06F16/18;G06F16/172;G06Q30/02;H04L29/08
代理公司: 北京市京大律师事务所 11321 代理人: 刘挽澜
地址: 518033 广东省深圳市福田区益田路5033号*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 短期 用户 画像 生成 方法 装置 设备 可读 存储 介质
【说明书】:

发明涉及大数据技术领域,公开了一种长短期用户画像生成方法,包括以下步骤:从广播变量中获取分布式存储系统Hbase信息;根据用户编号拉取所述Hbase信息中的用户行为数据,计算实时兴趣得分和历史兴趣得分,根据实时兴趣得分与用户兴趣标签之间的预置映射关系,以及历史兴趣得分与用户兴趣标签之间的预置映射关系,得到长短期用户兴趣标签;将长短期用户兴趣标签转为杰森json格式,通过信息摘要算法MD5对用户的敏感信息进行加密,存入预置存储系统;获取长短期用户兴趣标签,并基于长短期用户兴趣标签生成长短期用户画像。本发明还提供了一种长短期用户画像生成装置、设备及可读存储介质,本发明提供的长短期用户画像生成方法提高了用户画像的准确率。

技术领域

本发明涉及大数据技术领域,尤其涉及一种长短期用户画像生成方法、装置、设备及可读存储介质。

背景技术

目前,随着移动互联网的迅猛发展,个性化系统成为众多企业应用大数据挖掘潜在商业价值的重要技术手段。用户兴趣画像作为一种抽象勾画目标用户的方法,具备精准、即时地分析用户行为、兴趣特征、消费行为的能力,因此受到越来越多企业的青睐。而用户画像系统通常是利用专业的用户标签体系来刻画。但现有用户画像系统主要采用离线处理的方式进行,不能保证实时性和即时地反馈。而近年来的实时系统通常采用传统的服务器方式开发部署,扩展性、容错性较差。一些实时的用户画像系统也没有基于目前领先的大数据处理技术,使得其不能高效的处理海量的用户日志数据及做一些复杂的运算以满足多变的市场的需求。实时的用户画像系统只能获取到用户当下、即时的兴趣标签,并不能有效的结合用户的历史行为,形成用户相对完整且准确的用户画像。如何提升用户画像的准确度,是目前本技术领域亟待解决的技术问题。

发明内容

本发明的主要目的在于提供一种长短期用户画像生成方法、装置、设备及可读存储介质,旨在解决现有的用户画像准确率低的技术问题。

从广播变量中获取分布式存储系统Hbase信息,其中,所述分布式存储系统Hbase信息包括:列、列簇信息;

根据用户编号拉取所述Hbase信息中的用户行为数据,并通过预置公式计算实时兴趣得分和历史兴趣得分,其中,所述用户行为数据包括:点击数据和购买数据;根据所述实时兴趣得分与用户兴趣标签之间的预置映射关系,以及历史兴趣得分与用户兴趣标签之间的预置映射关系,得到长短期用户兴趣标签;

将所述长短期用户兴趣标签转为杰森json格式,通过信息摘要算法MD5对用户的敏感信息进行加密,存入预置存储系统,其中,所述预置存储系统包括键-值存储系统Redis和分布式存储系统Hbase;

根据获取到的指令从所述预置存储系统中获取与所述指令相对应的长短期用户兴趣标签,并基于所述长短期用户兴趣标签生成长短期用户画像。

可选地,在所述从广播变量中获取分布式存储系统Hbase信息,其中,所述分布式存储系统Hbase信息包括:列、列簇信息之前,还包括:

通过流计算框架SparkStreaming程序创建SparkConf对象配置实例,以及将变更的数据加载到SparkConf对象,其中,所述SparkConf对象用于管理Spark的配置项,所述SparkStreaming包括驱动Driver端;

在驱动Driver端读取存储在分布式文件系统HDFS上的配置文件,其中,所述配置文件来自于开源流处理平台Kafka、分布式存储系统Hbase、键-值存储系统Redis端口和存储表名;

通过所述流计算框架SparkStreaming接收开源流处理平台卡夫卡Kafka的日志数据,形成Dstream格式的初始数据流,所述初始数据流分布于弹性分布式数据集的不同区域内;

对所述初始数据流进行预处理,得到目标数据流;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010138562.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top