[发明专利]一种基于多方安全计算的模型训练方法和系统有效
| 申请号: | 202110159936.9 | 申请日: | 2021-02-05 |
| 公开(公告)号: | CN112990475B | 公开(公告)日: | 2022-05-06 |
| 发明(设计)人: | 周亚顺;赵原;尹栋 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/71 |
| 代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多方 安全 计算 模型 训练 方法 系统 | ||
1.一种基于多方安全计算的模型训练方法,应用于第一计算方,所述第一计算方持有标签矩阵以及模型参数矩阵的第一分片;所述方法包括对模型参数进行一轮或多轮迭代更新,其中一轮迭代更新包括:
基于模型参数矩阵的第一分片,与其他计算方协同运算,获得第一乘积矩阵的第一分片;其中,所述其他计算方持有特征矩阵以及模型参数矩阵的第二分片;所述第一乘积矩阵为模型参数矩阵与特征矩阵的乘积;
基于所述第一乘积矩阵的第一分片,与所述其他计算方协同运算,获得激活矩阵的第一分片,其中,所述激活矩阵的元素为第一乘积矩阵中对位元素的激活函数值;
基于所述激活矩阵的第一分片和所述标签矩阵,与所述其他计算方协同运算,获得当前轮的梯度矩阵的第一分片;其中,所述梯度矩阵为激活矩阵与标签矩阵之差与特征矩阵的乘积;
基于前一轮的动量梯度矩阵的第一分片与当前轮的梯度矩阵的第一分片,确定当前轮的动量梯度矩阵的第一分片;
基于所述模型参数矩阵的第一分片与所述当前轮的动量梯度矩阵的第一分片,确定更新后的模型参数矩阵的第一分片。
2.如权利要求1所述的方法,所述激活函数值通过激活函数的拟合多项式计算得到;所述基于所述第一乘积矩阵的第一分片,与所述其他计算方协同运算,获得激活矩阵的第一分片,包括:
所述基于所述第一乘积矩阵的第一分片,与所述其他计算方协同运算以基于所述拟合多项式获得激活矩阵的第一分片。
3.如权利要求1所述的方法,当所述一轮迭代更新为第一轮迭代更新时,所述前一轮的动量梯度矩阵的第一分片为0;所述一轮迭代更新为第二轮迭代更新时,所述前一轮的动量梯度矩阵的第一分片为第一轮的梯度矩阵的第一分片。
4.如权利要求1或3所述的方法,所述当前轮的动量梯度矩阵的第一分片为前一轮的动量梯度矩阵的第一分片与当前轮的梯度矩阵的第一分片的加权和值。
5.如权利要求1所述的方法,所述基于所述模型参数矩阵的第一分片与所述当前轮的动量梯度矩阵的第一分片,确定更新后的模型参数矩阵的第一分片,包括:
将所述当前轮的动量梯度矩阵的第一分片与预设学习率相乘,得到第二乘积矩阵;
计算所述模型参数矩阵的第一分片和所述第二乘积矩阵的差值,将差值确定为更新后的模型参数矩阵的第一分片。
6.一种基于多方安全计算的模型训练系统,应用于第一计算方,所述第一计算方持有标签矩阵以及模型参数矩阵的第一分片;所述系统用于对模型参数进行一轮或多轮迭代更新,其中所述系统包括:
第一获得模块,用于基于模型参数矩阵的第一分片,与其他计算方协同运算,获得第一乘积矩阵的第一分片;其中,所述其他计算方持有特征矩阵以及模型参数矩阵的第二分片;所述第一乘积矩阵为模型参数矩阵与特征矩阵的乘积;
第二获得模块,用于基于所述第一乘积矩阵的第一分片,与所述其他计算方协同运算,获得激活矩阵的第一分片,其中,所述激活矩阵的元素为第一乘积矩阵中对位元素的激活函数值;
第三获得模块,用于基于所述激活矩阵的第一分片和所述标签矩阵,与所述其他计算方协同运算,获得当前轮的梯度矩阵的第一分片;其中,所述梯度矩阵为激活矩阵与标签矩阵之差与特征矩阵的乘积;
第一确定模块,用于基于前一轮的动量梯度矩阵的第一分片与当前轮的梯度矩阵的第一分片,确定当前轮的动量梯度矩阵的第一分片;
第二确定模块,用于基于所述模型参数矩阵的第一分片与所述当前轮的动量梯度矩阵的第一分片,确定更新后的模型参数矩阵的第一分片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110159936.9/1.html,转载请声明来源钻瓜专利网。





