[发明专利]一种数据处理方法、装置、服务器及联邦学习系统有效

申请号：	201911400308.4	申请日：	2019-12-30
公开（公告）号：	CN111177762B	公开（公告）日：	2022-11-08
发明（设计）人：	李丽浓;郑全乐	申请（专利权）人：	北京同邦卓益科技有限公司
主分类号：	G06F21/60	分类号：	G06F21/60
代理公司：	北京华夏泰和知识产权代理有限公司 11662	代理人：	郭金鑫;李雪
地址：	100176 北京市大兴区经济技术***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据处理方法装置服务器联邦学习系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请涉及一种数据处理方法、装置、服务器及联邦学习系统，该技术方案中，数据碰撞的双方都对待碰撞数据采用随机数及安全性较高的加密算法进行不可逆及随机混淆加盐的加密处理，同一待碰撞数据实际上被加密了两次，且双方所使用的密钥为密钥对，这样，对加密后的数据进行碰撞，在保证数据交互的双方能够准确进行数据碰撞的同时，使得恶意第三方即使截获数据也无法破解，数据交互的双方也无法破解碰撞失败的数据，提高数据碰撞的安全性。

技术领域

本申请涉及数据处理领域，尤其涉及一种数据处理方法、装置、服务器及联邦学习系统。

背景技术

随着大数据、机器学习、人工智能等技术的广泛应用，越来越多的机构达成联盟，搭建联邦学习平台，在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下，在多参与方或多计算结点之间开展高效率的机器学习。

联邦学习平台构建的第一步是识别共有数据，而高安全低风险数据碰撞方案是识别共有数据的关键。传统的数据碰撞方案是基于哈希的数据碰撞方法，即将输入数据映射成哈希值，如果不同的输入数据经过哈希函数后得到同一哈希值，就发生了“哈希碰撞”(collision)。举例来说，很多服务会使用哈希函数，根据用户信息生成一个身份令牌，以标识用户的身份和权限。如果两个不同的用户信息经过哈希函数后，得到了相同的身份令牌，就发生了哈希碰撞，则服务器将这两个用户视为同一人。

“哈希碰撞”方案虽实现简单、加密过程不可逆，但存在被暴力破解的可能。可通过简单直接的猜测方法，将每个猜测值进行哈希处理后的结果与目标值进行对比，两个值相同则意味着破译成功。常用的破解方法有字典攻击、暴力攻击、查表法、方向查表法和彩虹表等等。为了保证用户信息等敏感数据无泄露的风险，简单“哈希碰撞”方案无法满足高安全性业务需求，因而需要一种更加安全的数据碰撞方案。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请实施例提供了一种数据处理方法、装置、服务器及联邦学习系统。

第一方面，本申请实施例提供了一种数据处理方法，包括：

根据第一随机数及密钥对中的第一密钥信息对本地的第一数据进行加密，得到第一加密数据；

获取关联服务器采用第二随机数及所述密钥对中的第二密钥信息对所述第一加密数据加密得到的第二加密数据；

获取所述关联服务器采用所述第二随机数及所述第二密钥信息对所述关联服务器本地的第二数据加密得到的第三加密数据；

根据所述第一随机数及所述第一密钥信息对所述第三加密数据进行加密，得到第四加密数据；

确定所述第二加密数据与所述第四加密数据的交集，得到所述第一数据和第二数据之间的共有数据。

可选的，所述方法还包括：

确定所述关联服务器；

查询所述关联服务器对应的所述第一密钥信息。

可选的，所述第一密钥信息包括预设数和第一密钥；