[发明专利]用户ID关联方法、系统及批式、流式数据处理方法在审
| 申请号: | 202011394658.7 | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN112395321A | 公开(公告)日: | 2021-02-23 |
| 发明(设计)人: | 邵真奇;张波 | 申请(专利权)人: | 恩亿科(北京)数据科技有限公司 |
| 主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06F16/28 |
| 代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 李红岩 |
| 地址: | 100192 北京市海淀区西小口路66*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 id 关联 方法 系统 数据处理 | ||
本申请涉及一种用户关联方法、系统和基于批式和流式计算的SuperID计算方法,其中,该用户关联方法包括:数据获取步骤,用于获取一上游系统的待处理用户的多个原始ID及原始ID之间的绑定关系,并获取所述原始ID的唯一标识值,所述唯一标识值包括原始ID的类型IDType、原始ID对应的值IDValue;SuperID定义步骤,用于定义一SuperID用于标识通过一绑定关系或多绑定关系互相连接的所述原始ID;用户ID关联步骤,用于基于一绑定规则获取属于同一SuperID的所述原始ID,得到关联ID。通过本申请,解决用户ID过度关联及错误关联的问题,降低硬件成本及维护成本。
技术领域
本申请涉及互联网技术领域,特别是涉及一种用户ID关联方法、系统及批式数据处理方法、流式数据处理方法。
背景技术
随着数字化越来越兴起,消费者越来越多的行为能够被采集并数字化记录下来,例如:广告行为,APP行为,微信行为,线下消费行为等等。
但由于各领域本身的独立性,不同领域日志记录的消费者原始ID是不同的,例如:广告行为一般是基于IMEI/IDFA做消费者唯一识别符;微信行为一般基于open_id/union_id做消费者的识别符;购买行为一般基于会员号做唯一识别符。即在没有“用户ID关联”的情况下,企业主无法串联各领域的消费者数据,或者更准确的说,跨ID分析单个消费者的全路径行为,从而形成更加全面的洞察和策略。
但是,简单地将所有渠道的ID做“全关联打通”,在部分数据准确性较高地场景下会造成过度关联。例如,在同一台电脑通过浏览器登录两个会员账号,认为该两个会员账号关联同一个cookie,而将这两个会员账号认为是同一个人,显然是有不够精准的现象。“全关联”方式下,虽然会最大的增加用户ID关联,但也会极大增加错误关联,造成业务损失,具体包括:数据分析时,由于关联ID过度,造成分析的错误和异常;营销触达时,由于关联ID过度,造成触达浪费和消费者反感。而行业内经常使用的“图数据库”存在硬件成本高、维护成本高的难点。
基于此,我们需要一种更好的、符合业务逻辑的解决方案。
发明内容
本申请实施例提供了一种用户关联方法、系统和基于批式和流式计算的SuperID计算方法,解决用户ID过度关联及错误关联的问题,降低硬件成本及维护成本。
第一方面,本申请实施例提供了一种用户ID关联方法,包括:
数据获取步骤,用于获取待处理用户的多个原始ID及原始ID之间的绑定关系,并获取所述原始ID的唯一标识值,所述唯一标识值包括原始ID的类型IDType、原始ID对应的值IDValue;
SuperID定义步骤,用于定义一SuperID以标识通过至少一绑定关系互相连接的所述原始ID;
用户ID关联步骤,用于基于一绑定规则获取属于同一SuperID的所述原始ID,得到关联ID。
在其中一些实施例中,所述SuperID通过锚点取值,所述锚点为业务优先级最高的ID和/或时间最早的ID或记录。
在其中一些实施例中,所述绑定规则进一步包括:
规则一,每一所述原始ID只能直接绑定一个高优先级原始ID,以保证多个所述原始ID不会因为关联同一低级原始ID而关联;
规则二,每一所述原始ID不能直接绑定同一优先级多个所述原始ID;
规则三,当一所述原始ID拥有多个高优先级绑定关系时,取唯一有效绑定关系。
基于上述绑定规则,在多个冲突的关联关系中,选择业务上优先级最高的关联关系,保证关联的可靠性、提高关联准确性。
在其中一些实施例中,所述规则三中,取唯一有效绑定关系具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恩亿科(北京)数据科技有限公司,未经恩亿科(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011394658.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于自然语言模型的码床系统
- 下一篇:一种连续式喂料的球磨机





