[发明专利]数据融合方法、装置和计算机可读存储介质在审
| 申请号: | 202010099067.0 | 申请日: | 2020-02-18 |
| 公开(公告)号: | CN111325267A | 公开(公告)日: | 2020-06-23 |
| 发明(设计)人: | 何华均;鲍捷;王涵 | 申请(专利权)人: | 京东城市(北京)数字科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 李昊;方亮 |
| 地址: | 100086 北京市海淀区知*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 融合 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种数据融合方法、装置和计算机可读存储介质,涉及数据处理技术领域。数据融合方包括:根据目标用户实体和待匹配用户实体的时空数据集,确定目标用户实体和每个待匹配用户实体的匹配度,其中,每个用户实体的时空数据集中包括用户实体的多个时空数据,每个时空数据包括用户实体的空间信息和时间信息;根据目标用户实体和每个待匹配用户实体的匹配度,确定与目标用户实体匹配的待匹配用户实体;将目标用户实体的数据和与目标用户实体匹配的待匹配用户实体的数据进行融合。从而,本发明能够准确地确定对应同一实际用户的目标用户实体和待匹配用户实体,在保护用户隐私的前提下提高了数据融合的准确性。
技术领域
本发明涉及数据处理技术领域,特别涉及一种数据融合方法、装置和计算机可读存储介质。
背景技术
在移动互联网时代产生了大量数据。基于单一数据源的用户画像只能得到用户的片面信息。如何打破数据壁垒、全面精准地刻画用户成为了难点。
多源数据融合及画像预测是指通过各类技术手段,将不同数据识别为同一个对象或主体,以全面、精准地提取用户等对象的特征。该技术可广泛应用于推荐、智能风控、智能交通等领域。
在相关技术中,多源数据融合及画像预测技术主要有以下几种。
(1)基于实名信息的多源数据融合。这种方式以用户实名信息为基准进行多源数据融合。用户实名信息包含证件号、手机号、姓名、银行卡号、实名后分配的登录账号等。
(2)基于物理层面的多源数据融合。这种方式以用户设备信息为基准进行多源数据融合,包含IMEI(International Mobile Equipment Identity,国际移动设备身份码)、MAC(Media Access Control,媒体访问控制)地址、IDFA(Identifier For Advertising,广告标识符)、IDFV(Identifier For Vendor,供应商标识符)、UUID(Universally UniqueIdentifier,通用唯一识别码)、OpenUDID、Cookies、IP地址等。
(3)基于群像刻画的多源数据融合。针对地块或某一群体特征,进行多源数据融合。例如,一方提供的数据为北京市朝阳区女性为50万,另一方提供的数据为北京市朝阳区流动人口为200万。
(4)基于联邦学习的多源数据融合及画像预测。这种方式在数据隔离及保证模型质量无损的情况下进行多源数据融合及画像预测。
发明内容
发明人经过分析后发现,基于实名信息和物理层面的方式会泄露用户隐私。并且,基于物理层面的方式会由于设备变更而带来融合准确性的问题;基于群像刻画的方式粒度较粗,也存在准确性的问题。基于联邦学习的方式需要引入可信的第三方,在部分场景中也无法达到理想效果。
本发明实施例所要解决的一个技术问题是:如何在保护用户隐私的前提下,提高多源数据融合的准确性。
根据本发明一些实施例的第一个方面,提供一种数据融合方法,包括:根据目标用户实体和待匹配用户实体的时空数据集,确定目标用户实体和每个待匹配用户实体的匹配度,其中,每个用户实体的时空数据集中包括用户实体的多个时空数据,每个时空数据包括用户实体的空间信息和时间信息;根据目标用户实体和每个待匹配用户实体的匹配度,确定与目标用户实体匹配的待匹配用户实体;将目标用户实体的数据和与目标用户实体匹配的待匹配用户实体的数据进行融合。
在一些实施例中,根据目标用户实体和待匹配用户实体的时空数据集,确定目标用户实体和每个待匹配用户实体的匹配度包括:对目标用户实体的每个时空数据进行时间和空间扩展,生成目标用户实体的每个时空数据的匹配范围;根据位于目标用户实体的时空数据的匹配范围中的待匹配用户实体的时空数据,确定目标用户实体和每个待匹配用户实体的匹配度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东城市(北京)数字科技有限公司,未经京东城市(北京)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010099067.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:主链游戏结果展示方法、设备和存储介质
- 下一篇:一种唇语识别方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





