[发明专利]模型训练方法、装置及系统有效
| 申请号: | 201910600330.7 | 申请日: | 2019-07-04 |
| 公开(公告)号: | CN112183564B | 公开(公告)日: | 2023-08-11 |
| 发明(设计)人: | 陈超超;李梁;王力;周俊 | 申请(专利权)人: | 创新先进技术有限公司 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F17/16;G06N20/00 |
| 代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉 |
| 地址: | 英属开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 系统 | ||
本公开提供用于训练线性/逻辑回归模型的方法和装置。在该方法中,执行下述迭代过程,直到满足预定条件:基于各个训练参与方的当前子模型以及训练发起方的特征样本集,使用无可信初始化方秘密共享矩阵乘法来获得针对特征样本集的当前预测值;训练发起方确定当前预测值与对应的标记值之间的预测差值,基于预测差值和特征样本集来确定模型更新量;将模型更新量分割为第一数目个部分模型更新量,并且将第二数目个部分模型更新量中的每个分别发送给对应的训练协同方,第二数目等于第一数目减一;各个训练参与方基于各自的当前子模型以及对应的部分模型更新量来更新当前子模型。该方法能够在保证各方数据安全的情况下提高模型训练的效率。
技术领域
本公开通常涉及机器学习领域,尤其涉及用于使用水平切分的训练集来经由多个训练参与方协同训练线性/逻辑回归模型的方法、装置及系统。
背景技术
线性回归模型和逻辑回归模型是机器学习领域广泛使用的回归/分类模型。在很多情况下,多个模型训练参与方(例如,电子商务公司、快递公司和银行)各自拥有训练线性/逻辑回归模型所使用的特征样本的不同部分数据。该多个模型训练参与方通常想共同使用彼此的数据来统一训练线性/逻辑回归模型,但又不想把各自的数据提供给其它各个模型训练参与方以防止自己的数据被泄露。
面对这种情况,提出了能够保护数据安全的机器学习方法,其能够在保证多个模型训练参与方的各自数据安全的情况下,协同该多个模型训练参与方来训练线性/逻辑回归模型,以供该多个模型训练参与方使用。然而,现有的能够保护数据安全的机器学习方法的模型训练效率较低。
发明内容
鉴于上述问题,本公开提供了一种用于经由多个训练参与方协同训练线性/逻辑回归模型的方法、装置及系统,其能够在保证多个训练参与方的各自数据安全的情况下提高模型训练的效率。
根据本公开的一个方面,提供了一种用于经由多个训练参与方来协同训练线性/逻辑回归模型的方法,所述线性/逻辑回归模型由第一数目个子模型组成,每个训练参与方具有一个子模型,所述第一数目等于所述训练参与方的数目,所述训练参与方包括训练发起方和至少一个训练协同方,所述方法由训练发起方执行,所述方法包括:执行下述迭代过程,直到满足预定条件:基于各个训练参与方的当前子模型以及所述训练发起方的特征样本集,使用无可信初始化方秘密共享矩阵乘法来获得所述线性/逻辑回归模型针对所述特征样本集的当前预测值;确定所述特征样本集的当前预测值与对应的标记值之间的预测差值;基于所确定出的预测差值和所述特征样本集,确定模型更新量;将所确定出的模型更新量分割为所述第一数目个部分模型更新量,并且将第二数目个部分模型更新量中的每个分别发送给对应的训练协同方,所述第二数目等于所述第一数目减一;以及基于所述训练发起方的当前子模型以及对应的部分模型更新量来更新所述训练发起方的子模型,其中,在迭代过程未结束时,所述更新后的各个训练参与方的子模型被用作下一迭代过程的当前子模型。
根据本公开的另一方面,提供一种用于经由多个训练参与方来协同训练线性/逻辑回归模型的方法,所述线性/逻辑回归模型由第一数目个子模型组成,每个训练参与方具有一个子模型,所述第一数目等于所述训练参与方的数目,所述训练参与方包括训练发起方和至少一个训练协同方,所述方法由训练协同方执行,所述方法包括:执行下述迭代过程,直到满足预定条件:基于各个训练参与方的当前子模型以及所述训练发起方的特征样本集,使用无可信初始化方秘密共享矩阵乘法来获得所述线性/逻辑回归模型针对所述特征样本集的当前预测值;从所述训练发起方接收对应的部分模型更新量,其中,所述部分模型更新量是在所述训练发起方处对模型更新量进行分割后得到的所述第一数目个部分模型更新量中的一个部分模型更新量,所述模型更新量是在所述训练发起方处基于所确定出的当前预测值和对应的标记值之间的预测差值以及所述特征样本集确定出的;以及基于所述训练协同方的当前子模型以及所接收的部分模型更新量来更新所述训练协同方的子模型,其中,在迭代过程未结束时,所述更新后的各个训练参与方的子模型被用作下一训练迭代过程的当前子模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910600330.7/2.html,转载请声明来源钻瓜专利网。





