[发明专利]一种联邦学习的数据隐私保护方法有效
申请号: | 202010808771.9 | 申请日: | 2020-08-12 |
公开(公告)号: | CN111935156B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 吴炎泉;陈思恩;杨紫胜;廖雅哲 | 申请(专利权)人: | 科技谷(厦门)信息技术有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L67/10;G06F21/60;G06F21/64 |
代理公司: | 厦门致群财富专利代理事务所(普通合伙) 35224 | 代理人: | 刘兆庆;邓贵琴 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联邦 学习 数据 隐私 保护 方法 | ||
本发明公开了一种联邦学习的数据隐私保护方法,包括自治和联合两个步骤,所述自治具体为:两个或两个以上的参与方在各自的终端安装初始化的模型,每个参与方拥有相同的模型,参与方各自使用当地的数据训练模型得到不同的模型参数;所述联合具体为:参与方将所述不同的模型参数同时上传到云端,由所述云端完成模型参数的聚合与更新,并且将更新好的参数返回到各参与方的终端,所述各参与方的终端开始下一次的迭代,重复以上的步骤,直到整个训练过程收敛。本发明实现了在数据不出本地的条件下进行联合建模,利用模型参数的交互代替数据的直接交换,既实现了数据的交互,又解决了数据的隐私和安全问题。
技术领域
本发明涉及计算机技术领域,特别涉及一种联邦学习的数据隐私保护方法。
背景技术
人工智能对于场景和数据的依赖性极大,优质的数据直接决定了模型的质量,但数据的获取却变得困难。这种困境主要在于两个方面:一方面,数据孤岛现象严重,大部分的数据掌握在政府、运营商、互联网企业等三大“数据岛屿群”中,数据的利用率低,成本高;另一方面,数据安全与用户隐私问题越来越受到人们的重视,数据监管愈发严格,数据互通愈发困难。
发明内容
为解决上述问题,本发明提供了一种联邦学习的数据隐私保护方法。
本发明采用以下技术方案:
一种联邦学习的数据隐私保护方法,包括自治和联合两个步骤,所述自治具体为:两个或两个以上的参与方在各自的终端安装初始化的模型,每个参与方拥有相同的模型,参与方各自使用当地的数据训练模型得到不同的模型参数;所述联合具体为:参与方将所述不同的模型参数同时上传到云端,由所述云端完成模型参数的聚合与更新,并且将更新好的参数返回到各参与方的终端,所述各参与方的终端开始下一次的迭代,重复以上的步骤,直到整个训练过程收敛。
进一步地,所述参与方采用企业A和企业B,所述云端采用协作者C。
进一步地,包括如下步骤:
S1、企业A和企业B接受来自协作者C发来的用于加密的公钥,在不公开各自数据的前提下,进行用户样本对齐,确认双方共有用户群体;
S2、企业A和企业B在各自终端安装相同的初始化模型,并利用双方共有用户群体的数据进行模型训练,所述模型训练过程如下:
S21、企业A和企业B在各自的终端安装相同的初始化模型,输入双方共有用户群体数据进行训练;
S22、企业A和企业B之间以加密形式交换用于计算梯度的中间结果;
S23、企业A和企业B分别在加密的条件下进行梯度值的计算,同时企业B根据其标签数据计算损失,企业A和企业B把计算结果汇总给协作者C,协作者C通过汇总结果计算总梯度与损失并将其解密;
S24、协作者C将解密后的总梯度分别回传给企业A和企业B,企业A和企业B根据梯度更新各自模型的参数,并根据更新的模型参数进行下一次的迭代,直到整个训练过程收敛。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明本发明样本对齐和模型训练的过程中,各参与方的数据均保留在本地,且训练中的数据交互采用加密的模型参数进行交互,而不是直接的数据交换,不会导致数据隐私的泄露,实现了在数据不出本地的情况下进行联合建模,且保证了数据的安全;同时各参与方通过联邦学习合作训练的模型整合了多方的数据,实现了数据的共享。
附图说明
图1为本发明实施例的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科技谷(厦门)信息技术有限公司,未经科技谷(厦门)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010808771.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置