[发明专利]数据融合方法、装置和计算机可读存储介质在审

专利信息
申请号: 202010099067.0 申请日: 2020-02-18
公开(公告)号: CN111325267A 公开(公告)日: 2020-06-23
发明(设计)人: 何华均;鲍捷;王涵 申请(专利权)人: 京东城市(北京)数字科技有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 李昊;方亮
地址: 100086 北京市海淀区知*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 融合 方法 装置 计算机 可读 存储 介质
【说明书】:

发明公开了一种数据融合方法、装置和计算机可读存储介质,涉及数据处理技术领域。数据融合方包括:根据目标用户实体和待匹配用户实体的时空数据集,确定目标用户实体和每个待匹配用户实体的匹配度,其中,每个用户实体的时空数据集中包括用户实体的多个时空数据,每个时空数据包括用户实体的空间信息和时间信息;根据目标用户实体和每个待匹配用户实体的匹配度,确定与目标用户实体匹配的待匹配用户实体;将目标用户实体的数据和与目标用户实体匹配的待匹配用户实体的数据进行融合。从而,本发明能够准确地确定对应同一实际用户的目标用户实体和待匹配用户实体,在保护用户隐私的前提下提高了数据融合的准确性。

技术领域

本发明涉及数据处理技术领域,特别涉及一种数据融合方法、装置和计算机可读存储介质。

背景技术

在移动互联网时代产生了大量数据。基于单一数据源的用户画像只能得到用户的片面信息。如何打破数据壁垒、全面精准地刻画用户成为了难点。

多源数据融合及画像预测是指通过各类技术手段,将不同数据识别为同一个对象或主体,以全面、精准地提取用户等对象的特征。该技术可广泛应用于推荐、智能风控、智能交通等领域。

在相关技术中,多源数据融合及画像预测技术主要有以下几种。

(1)基于实名信息的多源数据融合。这种方式以用户实名信息为基准进行多源数据融合。用户实名信息包含证件号、手机号、姓名、银行卡号、实名后分配的登录账号等。

(2)基于物理层面的多源数据融合。这种方式以用户设备信息为基准进行多源数据融合,包含IMEI(International Mobile Equipment Identity,国际移动设备身份码)、MAC(Media Access Control,媒体访问控制)地址、IDFA(Identifier For Advertising,广告标识符)、IDFV(Identifier For Vendor,供应商标识符)、UUID(Universally UniqueIdentifier,通用唯一识别码)、OpenUDID、Cookies、IP地址等。

(3)基于群像刻画的多源数据融合。针对地块或某一群体特征,进行多源数据融合。例如,一方提供的数据为北京市朝阳区女性为50万,另一方提供的数据为北京市朝阳区流动人口为200万。

(4)基于联邦学习的多源数据融合及画像预测。这种方式在数据隔离及保证模型质量无损的情况下进行多源数据融合及画像预测。

发明内容

发明人经过分析后发现,基于实名信息和物理层面的方式会泄露用户隐私。并且,基于物理层面的方式会由于设备变更而带来融合准确性的问题;基于群像刻画的方式粒度较粗,也存在准确性的问题。基于联邦学习的方式需要引入可信的第三方,在部分场景中也无法达到理想效果。

本发明实施例所要解决的一个技术问题是:如何在保护用户隐私的前提下,提高多源数据融合的准确性。

根据本发明一些实施例的第一个方面,提供一种数据融合方法,包括:根据目标用户实体和待匹配用户实体的时空数据集,确定目标用户实体和每个待匹配用户实体的匹配度,其中,每个用户实体的时空数据集中包括用户实体的多个时空数据,每个时空数据包括用户实体的空间信息和时间信息;根据目标用户实体和每个待匹配用户实体的匹配度,确定与目标用户实体匹配的待匹配用户实体;将目标用户实体的数据和与目标用户实体匹配的待匹配用户实体的数据进行融合。

在一些实施例中,根据目标用户实体和待匹配用户实体的时空数据集,确定目标用户实体和每个待匹配用户实体的匹配度包括:对目标用户实体的每个时空数据进行时间和空间扩展,生成目标用户实体的每个时空数据的匹配范围;根据位于目标用户实体的时空数据的匹配范围中的待匹配用户实体的时空数据,确定目标用户实体和每个待匹配用户实体的匹配度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东城市(北京)数字科技有限公司,未经京东城市(北京)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010099067.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top