[发明专利]一种两方决策树训练方法和系统有效
申请号: | 202010722953.4 | 申请日: | 2020-07-24 |
公开(公告)号: | CN111738359B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 方文静;王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F21/60;H04L9/00 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 袁春晓 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 决策树 训练 方法 系统 | ||
本说明书实施例公开了一种两方决策树训练方法和系统,以保护双方的数据隐私。对于任一方的特征,另一方的设备在密文形态下计算该特征下的各分组分别对应的梯度和,并将计算出的梯度和的密文转换成梯度和的一个分片和梯度和的另一个分片的密文,将梯度和的另一个分片的密文发送给所述任一方的设备。其中,密文的加密算法为同态加密算法,密文的加密密钥为所述任一方的公钥。两方的设备按照多方安全计算协议进行交互,以基于各特征下的各分组分别对应的梯度和的分片计算各特征下的各分组分别对应的分裂增益的分片。进而,两方的设备通过多方安全比较协议确定最大分裂增益对应的特征及分组,并按最大分裂增益对应的特征及分组分裂节点。
技术领域
本说明书涉及信息技术领域,特别涉及一种两方决策树训练方法和系统。
背景技术
为了保护各方数据隐私,在机器学习领域会采用分布式训练方案。即,在不泄露任一参与方持有的样本数据的前提下,任一参与方可训练属于自己的模型。
目前,希望提供一种针对决策树的分布式训练方案。
发明内容
本说明书实施例之一提供一种两方决策树训练方法,其中,所述方法由第一方的设备执行,所述第一方为持有样本集中各样本的至少一个特征的特征值及标签值的一方和持有所述样本集中各样本的至少一个特征的特征值的一方中任一方,第二方为两方中的另一方;所述方法包括:
按以下分裂步骤对任一节点进行分裂:
获得所述节点的标志向量的第一分片、第一梯度向量的第一分片以及第二梯度向量的第一分片;标志向量指示属于相应节点的样本,第一梯度向量包括属于相应节点的样本对应的第一梯度,第二梯度向量包括属于相应节点的样本对应的第二梯度。
用第一方的公钥对所述节点的第一梯度向量的第一分片进行同态加密,得到所述节点的第一梯度向量的第一分片的第一同态密文;用第一方的公钥对所述节点的第二梯度向量的第一分片进行同态加密,得到所述节点的第二梯度向量的第一分片的第一同态密文;将所述节点的第一梯度向量的第一分片的第一同态密文以及第二梯度向量的第一分片的第一同态密文发送给第二方的设备;第一同态密文的加密密钥为第一方的公钥。
用第二方的公钥对所述节点的第一梯度向量的第一分片进行同态加密,得到所述节点的第一梯度向量的第一分片的第二同态密文;用第二方的公钥对所述节点的第二梯度向量的第一分片进行同态加密,得到所述节点的第二梯度向量的第一分片的第二同态密文;从第二方的设备接收所述节点的第一梯度向量的第二分片的第二同态密文以及第二梯度向量的第二分片的第二同态密文;第二同态密文的加密秘钥为第二方的公钥。
对于第一方的任一特征:
对于按该特征的特征值划分所述样本集得到的多个第一分组中的每一个:计算所述节点的第一梯度向量的第一分片的第二同态密文以及第二分片的第二同态密文中与属于该第一分组的样本对应的元素之和,得到该第一分组对应的第一梯度和的第二同态密文;将该第一分组对应的第一梯度和的第二同态密文转换成该第一分组对应的第一梯度和的第一分片以及该第一分组对应的第一梯度和的第二分片的第二同态密文,将该第一分组对应的第一梯度和的第二分片的第二同态密文发送给第二方的设备,以使第二方的设备能够获得该第一分组对应的第一梯度和的第二分片;计算所述节点的第二梯度向量的第一分片的第二同态密文以及第二分片的第二同态密文中与属于该第一分组的样本对应的元素之和,得到该第一分组对应的第二梯度和的第二同态密文;将该第一分组对应的第二梯度和的第二同态密文转换成该第一分组对应的第二梯度和的第一分片以及该第一分组对应的第二梯度和的第二分片的第二同态密文,将该第一分组对应的第二梯度和的第二分片的第二同态密文发送给第二方的设备,以使第二方的设备能够获得该第一分组对应的第二梯度和的第二分片。
对于第二方的任一特征:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010722953.4/2.html,转载请声明来源钻瓜专利网。