[发明专利]基于同态加密的模型训练方法、装置及系统有效
申请号: | 202010630881.0 | 申请日: | 2020-07-03 |
公开(公告)号: | CN111523134B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 巫锡斌;陈超超;王力;王磊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 同态 加密 模型 训练 方法 装置 系统 | ||
本说明书的实施例提供用于经由第一和第二数据拥有方协同训练逻辑回归模型的方法。第一和第二数据拥有方具有的数据按照垂直切分方式组成逻辑回归模型的训练样本,第一和第二数据拥有方具有的模型按照垂直切分方式组成逻辑回归模型。各个数据拥有方共享各自的公钥,使用各自的模型和数据确定各自的预测值,并且使用第一数据拥有方的公钥进行预测值加密。第二数据拥有方根据各个数据拥有方的加密预测值,确定逻辑回归模型的第一加密预测差值以及第一加密梯度信息。第一和第二数据拥有方利用第一加密预测差值和第一加密梯度信息,使用同态加密算法确定第一和第二数据拥有方处的梯度信息。各个数据拥有方分别使用各自的梯度信息更新各自的模型。
技术领域
本说明书的实施例通常涉及人工智能领域,尤其涉及基于同态加密的模型训练方法、装置及系统。
背景技术
逻辑回归模型是机器学习领域广泛使用的回归/分类模型。在很多情况下,多个数据拥有方(例如,电子商务公司、快递公司和银行)各自拥有逻辑回归模型训练所使用的训练样本的不同部分数据。该多个数据拥有方通常想共同使用彼此的数据来统一训练逻辑回归模型,但又不想把各自的数据提供给其它各个数据拥有方以防止自己的数据被泄露。
面对这种情况,提出了能够保护数据安全的模型训练方法,其能够在保证数据拥有方的各自数据安全的情况下,由数据拥有方利用各自的隐私数据来协同训练逻辑回归模型。
发明内容
鉴于上述,本说明书的实施例提供用于经由第一和第二数据拥有方协同训练逻辑回归模型的方法,第一数据拥有方具有第一模型、第一数据、第一公钥和第一私钥,第二数据拥有方具有第二模型、第二数据、第二公钥、第二私钥和标签值,第一和第二数据按照垂直切分方式共同组成所述逻辑回归模型的训练样本,第一和第二模型按照垂直切分方式共同组成所述逻辑回归模型。利用该方法,能够在保证两个数据拥有方的各自数据安全的情况下实现基于同态加密的模型协同训练。
根据本说明书的实施例的一个方面,提供一种用于经由第一和第二数据拥有方协同训练逻辑回归模型的方法,第一数据拥有方具有第一模型、第一数据、第一公钥和第一私钥,第二数据拥有方具有第二模型、第二数据、第二公钥、第二私钥和标签值,所述第一和第二数据按照垂直切分方式共同组成所述逻辑回归模型的训练样本,所述第一和第二模型按照垂直切分方式共同组成所述逻辑回归模型,所述方法包括:在各个数据拥有方之间共享各自的公钥;在各个数据拥有方处分别使用各自的模型和数据确定各自的预测值,并且使用所述第一公钥来对所确定出的预测值进行加密;在所述第二数据拥有方处,获取所述第一数据提供方处的加密后的预测值,并根据各个数据拥有方处的加密后的预测值,确定所述逻辑回归模型的第一加密预测差值以及第一加密梯度信息;在所述第一数据拥有方和所述第二数据拥有方之间,利用所述第一加密预测差值和所述第一加密梯度信息,使用同态加密算法确定所述第一数据拥有方处的第一梯度信息和所述第二数据拥有方处的第二梯度信息;以及在所述第一数据拥有方和所述第二数据拥有方处,分别使用所述第一和第二梯度信息更新所述第一模型和所述第二模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010630881.0/2.html,转载请声明来源钻瓜专利网。