[发明专利]模型训练方法、装置和电子设备在审
申请号: | 201911282429.3 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111144576A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 李漓春;赵原;周亚顺 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/62;G06F21/60 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 周达;刘飞 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 | ||
1.一种模型训练方法,应用于第一方,所述第一方持有样本的特征数据,该方法包括:
根据特征数据,将样本标识集分割为多个子集,所述样本标识集包括多个样本标识;
接收每个样本标识所对应的第一梯度值密文和第二梯度值密文,所述第一梯度值密文和所述第二梯度值密文由同态加密算法分别对损失函数的第一梯度值和第二梯度值加密得到;
在每个子集内,将多个样本标识的第一梯度值密文同态相加,得到该子集的第一特征值密文,将多个样本标识的第二梯度值密文同态相加,得到该子集的第二特征值密文;
利用随机数分别对第一特征值密文和第二特征值密文进行掩盖,得到掩盖后的第一特征值密文和掩盖后的第二特征值密文;
向第二方发送每个子集所对应的掩盖后的第一特征值密文、以及掩盖后的第二特征值密文,以便于对数据处理模型的非叶子节点进行训练。
2.如权利要求1所述的方法,所述数据处理模型包括森林模型,所述森林模型包括至少一个树模型,所述树模型包括至少两个非叶子节点;
所述第一梯度值为一阶梯度值,所述第二梯度值为二阶梯度值。
3.如权利要求1所述的方法,样本的特征数据包括多个子数据,每个子数据对应一个维度;所述将样本标识集分割为多个子集,包括:
根据至少一个维度的子数据,将样本标识集分割为多个子集。
4.如权利要求1所述的方法,所述利用随机数分别对第一特征值密文和第二特征值密文进行掩盖,包括:
对随机数进行同态加密,得到随机数密文;将随机数密文分别与第一特征值密文和第二特征值密文进行同态运算,得到掩盖后的第一特征值密文和掩盖后的第二特征值密文;
所述同态运算包括以下之一或任意组合:同态加法运算、同态乘法运算。
5.如权利要求1所述的方法,采用以下任意一种方式,利用随机数分别对第一特征值密文和第二特征值密文进行掩盖:
方式一:
仅利用随机数对第一特征值密文进行掩盖,得到掩盖后的第一特征值密文;仅利用随机数对第二特征值密文进行掩盖,得到掩盖后的第二特征值密文;
方式二:
利用随机数和第一噪声数据对第一特征值密文进行掩盖,得到掩盖后的第一特征值密文;利用随机数对第二特征值密文进行掩盖,得到掩盖后的第二特征值密文;
方式三:
利用随机数和第一噪声数据对第一特征值密文进行掩盖,得到掩盖后的第一特征值密文;利用随机数和第二噪声数据对第二特征值密文进行掩盖,得到掩盖后的第二特征值密文;
方式四:
利用随机数对第一特征值密文进行掩盖,得到掩盖后的第一特征值密文;利用随机数和第二噪声数据对第二特征值密文进行掩盖,得到掩盖后的第二特征值密文。
6.如权利要求1所述的方法,所述第一特征值密文为E(g),所述掩盖后的第一特征值密文为E(gr);所述第二特征值密文为E(h),所述掩盖后的第二特征值密文为E((h+λ)×r2);
r为随机数,λ为正则项系数。
7.如权利要求1所述的方法,所述第一特征值密文为E(g),所述掩盖后的第一特征值密文为E(gr+s1);所述第二特征值密文为E(h),所述掩盖后的第二特征值密文为E((h+λ)×r2+s2);
r为随机数,λ为正则项系数,s1为第一噪声数据,s2为第一噪声数据。
8.一种模型训练方法,应用于第二方,所述第二方持有样本的标签数据,该方法包括:
接收子集所对应的掩盖后的第一特征值密文、以及掩盖后的第二特征值密文,所述子集通过对样本标识集进行分割得到,所述样本标识集包括多个样本标识;
分别对掩盖后的第一特征值密文和掩盖后的第二特征值密文进行解密,得到掩盖后的第一特征值和掩盖后的第二特征值;
利用掩盖后的第一特征值和掩盖后的第二特征值,计算分割增益因子,所述分割增益因子用于计算子集的分割增益,所述分割增益用于对数据处理模型的非叶子节点进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911282429.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:社交信息发布的方法及装置
- 下一篇:一种氰烷基取代的醌类化合物及其合成方法