[发明专利]基于多方的隐私数据联合训练模型的方法和装置在审
申请号: | 202011173882.3 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112199709A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 林晓彤;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06N20/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多方 隐私 数据 联合 训练 模型 方法 装置 | ||
1.一种基于多方的隐私数据联合训练模型的方法,所述多方包括第二方和多个第一方,所述多个第一方分别具有各自不同的第一对象集合中各对象的相同的第一特征项的第一隐私数据,以及相应的第一类别标签,所述多个第一方分别具有各自的第一子模型;所述第二方具有第二对象集合中各对象的第二特征项的第二隐私数据,以及相应的第二类别标签,所述第二对象集合与任一所述第一对象集合互相重叠,所述第二方具有第二子模型,所述方法由所述多个第一方中的任一第一方执行,所述方法包括:
利用本地第一对象集合中各对象的第一隐私数据和相应的第一类别标签,以及所述多个第一方中的其他第一方的第一隐私数据和相应的第一类别标签,基于横向联邦学习的方式,对本地的所述第一子模型进行第一阶段的训练,得到所述第一子模型对应的所述多个第一方共享的第一参数集合;
确定本地的第一对象集合与所述第二方具有的第二对象集合互相重叠的共同对象;
利用本地的所述共同对象分别对应的第一隐私数据,以及所述第二方的第二隐私数据和相应的第二类别标签,基于纵向联邦学习的方式,对本地的所述第一子模型进行第二阶段的训练,更新本地的所述第一子模型对应的第一参数集合;所述第二方得到其具有的第二子模型对应的第二参数集合。
2.如权利要求1所述的方法,其中,所述多个第一方的业务覆盖范围分别属于不同地域,且提供相同的业务类型;
所述第一方和所述第二方的业务覆盖范围包括同一地域,且提供不同的业务类型。
3.如权利要求1所述的方法,其中,所述第一类别标签和/或所述第二类别标签用于标识对象是否具有信用风险。
4.如权利要求1所述的方法,其中,所述对象为用户。
5.如权利要求1所述的方法,其中,所述基于横向联邦学习的方式,对本地的所述第一子模型进行第一阶段的训练,包括:
将本地第一对象集合中各对象的第一隐私数据作为所述第一子模型的输入,通过所述第一子模型输出第一预测类别;
根据各对象的第一预测类别和相应的第一类别标签,计算所述第一子模型的梯度;
将梯度进行加密,将加密后的梯度传输给服务器;以使所述服务器对从所述多个第一方分别接收到的加密后的梯度,通过安全聚合技术进行梯度聚合,得到聚合后的加密聚合梯度,再将加密聚合梯度分发给各个第一方;
从所述服务器接收所述加密聚合梯度,对所述加密聚合梯度解密,得到解密聚合梯度;
根据所述解密聚合梯度,确定所述第一子模型对应的所述多个第一方共享的第一参数集合。
6.如权利要求5所述的方法,其中,所述基于横向联邦学习的方式,对本地的所述第一子模型进行第一阶段的训练,还包括:
根据各对象的第一预测类别和相应的第一类别标签,确定第一预测损失;
当所述第一预测损失小于第一预设损失时,向所述服务器发送第一通知消息;
从所述服务器接收第二通知消息,所述第二通知消息用于通知所述多个第一方针对各自的第一子模型进行第一阶段的训练后的第一预测损失均小于第一预设损失;
确定第一阶段的训练完成。
7.如权利要求1所述的方法,其中,所述确定本地的第一对象集合与所述第二方具有的第二对象集合互相重叠的共同对象,包括:
利用本地的第一对象集合,以及所述第二方具有的第二对象集合,基于加密的实体关联技术,建立所述第一对象集合中的对象与所述第二对象集合中的对象的关联关系;
根据所述关联关系,确定所述互相重叠的共同对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011173882.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于用户隐私保护的图像处理方法及装置
- 下一篇:一种回转式高温好氧发酵装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置