[发明专利]用户标识映射方法及装置在审
| 申请号: | 201911393734.X | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111177481A | 公开(公告)日: | 2020-05-19 |
| 发明(设计)人: | 王昭 | 申请(专利权)人: | 北京友信科技有限公司 |
| 主分类号: | G06F16/901 | 分类号: | G06F16/901 |
| 代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 申雪梅 |
| 地址: | 100084 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 标识 映射 方法 装置 | ||
本公开是关于用户标识映射方法及装置。该用户标识映射方法包括:获取实时采集的待处理用户数据;将待处理用户数据映射为图数据库中的子图;待处理用户数据中的每一个用户标识对应于子图中一个节点;待处理用户数据中优先级最高的用户标识对应的节点与待处理用户数据中除优先级最高的用户标识之外的其它用户标识对应的节点分别相连形成子图的边;将待处理用户数据中优先级最高的用户标识,确定为待处理用户数据在用户画像系统的存储数据库中的行记录。本公开基于图数据库实时存储及更新用户标识组数据,用户画像系统可以实时获取用户标识映射关系及用户标识对应的用户数据,从而能够保证互联网广告、实时推荐、实时机器学习系统的正常运行。
技术领域
本公开涉及物联网设备技术领域,尤其涉及用户标识映射方法及装置。
背景技术
用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型,本质上是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识;构建用户画像的目的是为了还原用户信息,数据通常来源于用户相关的数据。在构建精准的用户画像时,面临着这样一个问题:不同的数据源只能收集到用户的一种或几种标识ID,比如业务方定义的UID、用户所使用设备的MAC、IMEI、Android ID及浏览器Cookie、登陆使用的手机号、登陆使用的邮箱、实名认证的身份证号、实名认证的银行卡号、银行卡预留手机号等,从而造成用户ID的不统一与零碎化。因此,为了做用户标签的整合,用户ID之间的强打通,如用户标识映射(ID-Mapping)成了用户画像系统构建的基础。
相关技术中,在业务数据及流数据落库之后,使用Spark GraphX技术批量处理用户标识组(ID pair)对应关系数据,将各种用户标识ID看成图的节点,将ID pair对应关系看作图的无向边,生成用户ID pair对应关系图的一个个连通分支子图,每个连通子图代表一个真正的用户,每个连通子图上的标识ID都是同一用户的等价、不同标识ID,这样就实现了ID-Mapping功能。
但是,相关技术是以全量数据、批处理的方式、每隔一段时间的执行一次更新全量ID-Mapping关系计算的模式进行,从而无法达到实时更新ID-Mapping关系的需求。比如用户画像系统新收集到一个MAC-mobile的ID pair,该关系不能立即在ID-Mapping系统中查询到,要等待一段时间执行连通子图生成后才能生效,在这之前不能使用查询到相关的用户ID标识数据,这种延迟影响互联网广告、实时推荐、实时机器学习系统的正常运行。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种用户标识映射方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种用户标识映射方法,包括:
获取实时采集的待处理用户数据;所述待处理用户数据中包括至少一个用户标识;
将所述待处理用户数据映射为图数据库中的子图;所述待处理用户数据中的每一个用户标识对应于所述子图中一个节点;所述待处理用户数据中优先级最高的用户标识对应的节点与所述待处理用户数据中除所述优先级最高的用户标识之外的其它用户标识对应的节点分别相连形成所述子图的边;
将所述待处理用户数据中优先级最高的用户标识,确定为所述待处理用户数据在用户画像系统的存储数据库中的行记录。
本公开的实施例提供的技术方案可以包括以下有益效果:该技术方案通过将实时采集的待处理用户数据映射为图数据库中的子图,将待处理用户数据中的每一个用户标识对应于子图中一个节点,实现基于图数据库实时存储及更新用户标识组数据,并通过确定待处理用户数据在用户画像系统的存储数据库中的行记录,使得用户画像系统可以实时获取用户标识映射关系及用户标识对应的用户数据,从而能够保证互联网广告、实时推荐、实时机器学习系统的正常运行。
在一个实施例中,所述将所述待处理用户数据映射为图数据库中的子图,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京友信科技有限公司,未经北京友信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393734.X/2.html,转载请声明来源钻瓜专利网。





