[发明专利]基于差分隐私的决策树建模方法、预测方法、设备及介质有效
| 申请号: | 202111085147.1 | 申请日: | 2021-09-16 |
| 公开(公告)号: | CN113705727B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 谢世茂;王耀乐;李开宇 | 申请(专利权)人: | 四川新网银行股份有限公司 |
| 主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F18/214;G06F21/62;G06F21/60;G06N20/20 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 梁田 |
| 地址: | 610000 四川省成都市中国(四川)自由*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 隐私 决策树 建模 方法 预测 设备 介质 | ||
1.基于差分隐私的决策树建模方法,其特征在于,该决策树建模方法应用于进行联邦学习和差分隐私的第一设备,第一设备采用联邦学习和差分隐私与第二设备进行交互,所述第一设备作为主动方,第二设备作为被动方;该决策树建模方法包括:
S1:主动方对每个建模特征数据进行初始化,给出初始随机预测值计算每个建模特征数据的一阶导数gi和二阶导数hi,及生成一个随机浮点数Δrate;将各个建模特征数据的一阶导数gi和二阶导数hi均乘以随机浮点数Δrate后发送给被动方,即主动方发送giΔrate和hiΔrate到被动方;
S2:被动方根据分箱数对各个建模特征数据进行等频分箱,并对每个箱当中的giΔrate以及hiΔrate进行求和,并将所有建模特征数据的各个分箱的一阶导数和、二阶导数和返回给主动方;
S3:主动方根据随机浮点数Δrate还原真实的导数和,计算每个可能的分位点增益,并记录最大增益所在的特征数据编号以及分裂点信息,进行一层分裂;
S4:主动方反复执行步骤S2~S3,直至满足停止条件,构建得到建模决策树。
2.根据权利要求1所述的基于差分隐私的决策树建模方法,其特征在于,步骤S1中一阶导数二阶导数为初始随机预测值,yi为样本数据的真实标签值。
3.根据权利要求1所述的基于差分隐私的决策树建模方法,其特征在于,步骤S1中生成一个随机浮点数Δrate,其中Δrate的取值为0到1之间的一个随机浮点数。
4.根据权利要求1所述的基于差分隐私的决策树建模方法,其特征在于,步骤S2包括以下子步骤:
被动方根据分箱数对各个建模特征数据进行等频分箱;
被动方对每个箱当中的giΔrate以及hiΔrate进行求和,得到一阶导数和gbint=∑i∈tgiΔrate,二阶导数和hbint=∑i∈thiΔrate,其中,giΔrate以及hiΔrate是在步骤S1中由主动方发送过来的;i表示第i分箱,i的取值范围为1~t;
被动方将所有建模特征数据的各个分箱的一阶导数和gbint、二阶导数和hbint返回给主动方。
5.根据权利要求4所述的基于差分隐私的决策树建模方法,其特征在于,步骤S3中的主动方根据随机浮点数Δrate还原真实的导数和,包括真实一阶导数和Gt、真实二阶导数和Ht,计算公式为:和
6.根据权利要求4所述的基于差分隐私的决策树建模方法,其特征在于,步骤S3中的计算每个可能的分位点增益,增益gain的计算公式为:
其中:代表t分位点之前所有的一阶导数和;代表t分位点之后的所有一阶导数和;代表t分位点之前所有的二阶导数和;代表t分位点之后所有的二阶导数和;λ和γ为正则化系数。
7.根据权利要求1所述的基于差分隐私的决策树建模方法,其特征在于,步骤S4中的停止条件为:所有的分裂点都没有带来增益时或者分裂达到预设层数时。
8.基于差分隐私的决策树预测方法,其特征在于,该决策树预测方法包括:
获取待测样本,并将所述待测样本输入至决策树分类模型中,以通过所述决策树分类模型获得待测样本的预测分类结果,并输出;其中,
所述决策树分类模型采用如权利要求1至7中任一所述的基于差分隐私的决策树建模方法构建得到的决策树分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111085147.1/1.html,转载请声明来源钻瓜专利网。





