[发明专利]一种两方决策树训练方法和系统有效
申请号: | 202010722953.4 | 申请日: | 2020-07-24 |
公开(公告)号: | CN111738359B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 方文静;王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F21/60;H04L9/00 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 决策树 训练 方法 系统 | ||
1.一种两方决策树训练方法,其中,所述方法由第一方的设备执行,所述第一方为持有样本集中各样本的至少一个特征的特征值及标签值的一方和持有所述样本集中各样本的至少一个特征的特征值的一方中任一方,第二方为两方中的另一方;所述方法包括:
按以下分裂步骤对任一节点进行分裂:
获得所述节点的标志向量的第一分片、第一梯度向量的第一分片以及第二梯度向量的第一分片;标志向量指示属于相应节点的样本,第一梯度向量包括属于相应节点的样本对应的第一梯度,第二梯度向量包括属于相应节点的样本对应的第二梯度;
用第一方的公钥对所述节点的第一梯度向量的第一分片进行同态加密,得到所述节点的第一梯度向量的第一分片的第一同态密文;用第一方的公钥对所述节点的第二梯度向量的第一分片进行同态加密,得到所述节点的第二梯度向量的第一分片的第一同态密文;将所述节点的第一梯度向量的第一分片的第一同态密文以及第二梯度向量的第一分片的第一同态密文发送给第二方的设备;第一同态密文的加密密钥为第一方的公钥;
用第二方的公钥对所述节点的第一梯度向量的第一分片进行同态加密,得到所述节点的第一梯度向量的第一分片的第二同态密文;用第二方的公钥对所述节点的第二梯度向量的第一分片进行同态加密,得到所述节点的第二梯度向量的第一分片的第二同态密文;从第二方的设备接收所述节点的第一梯度向量的第二分片的第二同态密文以及第二梯度向量的第二分片的第二同态密文;第二同态密文的加密秘钥为第二方的公钥;
对于第一方的任一特征:
对于按该特征的特征值划分所述样本集得到的多个第一分组中的每一个:计算所述节点的第一梯度向量的第一分片的第二同态密文以及第二分片的第二同态密文中与属于该第一分组的样本对应的元素之和,得到该第一分组对应的第一梯度和的第二同态密文;将该第一分组对应的第一梯度和的第二同态密文转换成该第一分组对应的第一梯度和的第一分片以及该第一分组对应的第一梯度和的第二分片的第二同态密文,将该第一分组对应的第一梯度和的第二分片的第二同态密文发送给第二方的设备,以使第二方的设备能够获得该第一分组对应的第一梯度和的第二分片;计算所述节点的第二梯度向量的第一分片的第二同态密文以及第二分片的第二同态密文中与属于该第一分组的样本对应的元素之和,得到该第一分组对应的第二梯度和的第二同态密文;将该第一分组对应的第二梯度和的第二同态密文转换成该第一分组对应的第二梯度和的第一分片以及该第一分组对应的第二梯度和的第二分片的第二同态密文,将该第一分组对应的第二梯度和的第二分片的第二同态密文发送给第二方的设备,以使第二方的设备能够获得该第一分组对应的第二梯度和的第二分片;
对于第二方的任一特征:
对于按该特征划分的特征值划分所述样本集得到的多个第二分组中的每一个:从第二方的设备获得该第二分组对应的第一梯度和的第一分片的第一同态密文,以及该第二分组对应的第二梯度和的第一分片的第一同态密文;利用第一方的私钥解密该第二分组对应的第一梯度和的第一分片的第一同态密文,得到该第二分组对应的第一梯度和的第一分片;利用第一方的私钥解密该第二分组对应的第二梯度和的第一分片的第一同态密文,得到该第二分组对应的第二梯度和的第一分片;其中,该第二分组对应的第一梯度和等于所述节点的第一梯度向量的第一分片和第二分片中与属于该第二分组的样本对应的元素之和,该第二分组对应的第二梯度和等于所述节点的第二梯度向量的第一分片和第二分片中与属于该第二分组的样本对应的元素之和;
按照多方安全计算协议与第二方的设备交互,以基于各特征下的各分组分别对应的第一梯度和的第一分片以及第二梯度和的第一分片,计算各特征下的各分组分别对应的分裂增益的第一分片;
按照多方安全比较协议与第二方的设备交互,以基于各特征下的各分组分别对应的分裂增益的第一分片,确定最大分裂增益,并根据所述最大分裂增益对应的特征及分组记录所述节点的分裂信息;
当所述最大分裂增益对应第一方的特征时,生成所述节点的左子树向量和右子树向量,所述左子树向量指示根据所述最大分裂增益对应的特征及分组划分所述样本集得到的左子集中的样本,所述右子树向量指示根据所述最大分裂增益对应的特征及分组划分所述样本集得到的右子集中的样本,左子集与左子树对应,右子集与右子树对应;将所述左子树向量拆分成第一分片和第二分片,并将所述左子树向量的第二分片发送给第二方的设备;将所述右子树向量拆分成第一分片和第二分片,并将所述右子树向量的第二分片发送给第二方的设备;当所述最大分裂增益对应第二方的特征时,从第二方的设备接收所述节点的左子树向量的第一分片和右子树向量的第一分片;
按照多方安全计算协议与第二方的设备交互,以基于所述节点的标志向量的第一分片以及所述左子树向量的第一分片,计算所述节点的左子树的标志向量的第一分片;按照多方安全计算协议与第二方的设备交互,以基于所述节点的标志向量的第一分片以及所述右子树向量的第一分片,计算所述节点的右子树的标志向量的第一分片;
按照多方安全计算协议与第二方的设备交互,以基于所述节点的第一梯度向量的第一分片以及所述节点的左子树的标志向量的第一分片,计算所述节点的左子树的第一梯度向量的第一分片;按照多方安全计算协议与第二方的设备交互,以基于所述节点的第二梯度向量的第一分片以及所述节点的左子树的标志向量的第一分片,计算所述节点的左子树的第二梯度向量的第一分片;
按照多方安全计算协议与第二方的设备交互,以基于所述节点的第一梯度向量的第一分片以及所述节点的右子树的标志向量的第一分片,计算所述节点的右子树的第一梯度向量的第一分片;按照多方安全计算协议与第二方的设备交互,以基于所述节点的第二梯度向量的第一分片以及所述节点的右子树的标志向量的第一分片,计算所述节点的右子树的第二梯度向量的第一分片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010722953.4/1.html,转载请声明来源钻瓜专利网。