[发明专利]基于多方的隐私数据联合训练模型的方法和装置在审
申请号: | 202011173882.3 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112199709A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 林晓彤;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06N20/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多方 隐私 数据 联合 训练 模型 方法 装置 | ||
本说明书实施例提供一种基于多方的隐私数据联合训练模型的方法和装置,方法包括:多个第一方中的任一第一方利用本地第一对象集合中各对象的第一隐私数据和第一类别标签,以及其他第一方的第一隐私数据和第一类别标签,基于横向联邦学习的方式,得到第一子模型对应的多个第一方共享的第一参数集合;确定本地的第一对象集合与第二方具有的第二对象集合互相重叠的共同对象;利用本地的共同对象分别对应的第一隐私数据,以及第二方的第二隐私数据和第二类别标签,基于纵向联邦学习的方式,更新本地的第一子模型对应的第一参数集合;第二方得到其具有的第二子模型对应的第二参数集合。能够提高训练后得到的模型的预测准确率。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于多方的隐私数据联合训练模型的方法和装置。
背景技术
随着人工智能、机器学习的普遍进步,可以基于多方的隐私数据联合训练模型,利用训练后的模型执行相应的预测任务。数据在建模中占有极其重要的地位,更多维、更丰富的数据有利于建立更准确、效果更好的模型。数据分布于多方,存在一定隐私安全问题,多方之间无法获取其他方的隐私数据。由于隐私保护及数据壁垒等问题,很难在保护各方的隐私数据的前提下,安全、全面的利用多方的隐私数据联合训练模型,因此训练后得到的模型的预测准确率不佳。
因此,希望能有改进的方案,能够安全、全面的利用多方的隐私数据联合训练模型,提高训练后得到的模型的预测准确率。
发明内容
本说明书一个或多个实施例描述了一种基于多方的隐私数据联合训练模型的方法和装置,能够安全、全面的利用多方的隐私数据联合训练模型,提高训练后得到的模型的预测准确率。
第一方面,提供了一种基于多方的隐私数据联合训练模型的方法,所述多方包括第二方和多个第一方,所述多个第一方分别具有各自不同的第一对象集合中各对象的相同的第一特征项的第一隐私数据,以及相应的第一类别标签,所述多个第一方分别具有各自的第一子模型;所述第二方具有第二对象集合中各对象的第二特征项的第二隐私数据,以及相应的第二类别标签,所述第二对象集合与任一所述第一对象集合互相重叠,所述第二方具有第二子模型,所述方法由所述多个第一方中的任一第一方执行,方法包括:
利用本地第一对象集合中各对象的第一隐私数据和相应的第一类别标签,以及所述多个第一方中的其他第一方的第一隐私数据和相应的第一类别标签,基于横向联邦学习的方式,对本地的所述第一子模型进行第一阶段的训练,得到所述第一子模型对应的所述多个第一方共享的第一参数集合;
确定本地的第一对象集合与所述第二方具有的第二对象集合互相重叠的共同对象;
利用本地的所述共同对象分别对应的第一隐私数据,以及所述第二方的第二隐私数据和相应的第二类别标签,基于纵向联邦学习的方式,对本地的所述第一子模型进行第二阶段的训练,更新本地的所述第一子模型对应的第一参数集合;所述第二方得到其具有的第二子模型对应的第二参数集合。
在一种可能的实施方式中,所述多个第一方的业务覆盖范围分别属于不同地域,且提供相同的业务类型;
所述第一方和所述第二方的业务覆盖范围包括同一地域,且提供不同的业务类型。
在一种可能的实施方式中,所述第一类别标签和/或所述第二类别标签用于标识对象是否具有信用风险。
在一种可能的实施方式中,所述对象为用户。
在一种可能的实施方式中,所述基于横向联邦学习的方式,对本地的所述第一子模型进行第一阶段的训练,包括:
将本地第一对象集合中各对象的第一隐私数据作为所述第一子模型的输入,通过所述第一子模型输出第一预测类别;
根据各对象的第一预测类别和相应的第一类别标签,计算所述第一子模型的梯度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011173882.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于用户隐私保护的图像处理方法及装置
- 下一篇:一种回转式高温好氧发酵装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置