[发明专利]一种数据关联方法及装置在审
| 申请号: | 201910864588.8 | 申请日: | 2019-09-12 |
| 公开(公告)号: | CN112488140A | 公开(公告)日: | 2021-03-12 |
| 发明(设计)人: | 张孟旭;王际彭;蔡波 | 申请(专利权)人: | 北京国双科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
| 地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 关联 方法 装置 | ||
本发明提供了数据关联方法及装置,将两个不同RID对应的网络行为数据构造成一个待识别数据对。然后,从待识别数据对中提取能够表征这两组网络行为数据之间的相似程度的特征向量,并将该特征向量输入至预先训练得到的目标分类模型中进行分析得到这两组网络行为数据是否属于同一个用户的分类结果。如果分析得到这两组网络行为数据属于同一个用户则确定这两组网络行为数据对应的两个RID与同一个用户关联,即确定这两个RID属于同一个用户。通过上述方法能够从不同设备收集的来自不同数据源的RID中识别出属于同一个用户的多个RID,从而实现跨设备RID关联。
技术领域
本发明属于数据处理技术领域,尤其涉及一种数据关联方法及装置。
背景技术
随着网络技术飞速发展,人们基于网络的行为越来越多,网络中的用户行为数据、属性数据也越来越多。基于用户在网络中的行为数据及属性数据能够得到用户在多个维度的信息,从而得到用户画像。
用户的行为数据、属性数据分散在很多不同的服务器中,因此,从单个服务器看,都只是这个用户一个片面的画像。可以通过设备ID将同一设备内属于不同服务器的同一个用户的数据关联起来,从而得到该用户相对完整的画像。而同一个用户可能在不同的设备上都产生了用户行为数据、属性数据,但是,目前尚未有一种能够将来自不同设备的不同来源的同一用户的数据进行关联的方法。
发明内容
有鉴于此,本发明的目的在于提供一种数据关联方法及装置,将来自不同设备的不同来源的同一个用户的数据进行关联。
一方面,本发明提供了一种数据关联方法,包括:
获取来自不同设备的待关联的RID集合,所述RID用于区分不同的用户;
从所述待关联的RID集合中筛选得到多个待关联RID对,每个待关联RID对包括两个不同的RID;
获取每个待关联RID对中的每个RID所对应的网络行为数据集得到与每个待关联RID对相对应的待识别数据对;
对于任意一个待识别数据对,提取所述待识别数据对对应的特征向量,所述特征向量能够表征所述待识别数据对中的两个网络行为数据集的近似程度;
基于预先训练得到的目标分类模型,分析所述特征向量得到所述待识别数据对中的两个网络行为数据集是否属于同一个用户的分类结果;
当所述待识别数据对中的两个网络行为数据集属于同一个用户时,确定所述两个网络行为数据集对应的两个RID与同一用户相关联。
另一方面,本发明还提供一种数据关联装置,包括:
第一获取模块,用于获取来自不同设备的待关联的RID集合,所述RID用于区分不同的用户;
筛选模块,用于从所述待关联的RID集合中筛选得到多个待关联RID对,每个待关联RID对包括两个不同的RID;
第二获取模块,用于获取每个待关联RID对中的每个RID所对应的网络行为数据集得到与每个待关联RID对相对应的待识别数据对;
特征提取模块,用于对于任意一个待识别数据对,提取所述待识别数据对对应的特征向量,所述特征向量能够表征所述待识别数据对中的两个网络行为数据集的近似程度;
识别模块,用于基于预先训练得到的目标分类模型,分析所述特征向量得到所述待识别数据对中的两个网络行为数据集是否属于同一个用户的分类结果;
关联模块,用于当所述待识别数据对中的两个网络行为数据集属于同一个用户时,确定所述两个网络行为数据集对应的两个RID与同一用户相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864588.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:轴通风式污泥干化装置和操作方法
- 下一篇:一种防倾斜的危险品运输车车厢结构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





