[发明专利]保护隐私安全的多方联合进行特征评估的方法及装置有效
| 申请号: | 201911269227.5 | 申请日: | 2019-12-11 |
| 公开(公告)号: | CN110990857B | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 陆梦倩;汲小溪;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06N20/00 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 保护 隐私 安全 多方 联合 进行 特征 评估 方法 装置 | ||
1.一种保护隐私安全的多方联合进行特征评估的方法,所述多方至少包括第一设备和第二设备,第一设备存储有第一样本集和其中各样本的标签,第二设备存储有第二样本集,所述方法应用于第一设备;所述方法包括:
使用第一密钥对第一样本集中各样本的初始ID进行加密,得到第一样本集中各样本的第一次加密ID;
向所述第二设备发送第一交换信息,其中至少包括,第一样本集中每个样本的第一次加密ID和标签;
从所述第二设备分别接收第二交换信息和第三交换信息,其中,所述第二交换信息包括,由所述第二设备使用第二密钥对第一样本集中每个样本的第一次加密ID进行二次加密后得到的第二次加密ID和对应的标签,且所述第二交换信息中各样本的相对顺序已由所述第二设备扰乱;所述第三交换信息包括,针对第二样本集中每一个样本,由所述第二设备基于所述第二密钥对其初始ID进行加密得到的第一次加密ID和该样本所在第一分箱的标识,所述第一分箱的标识由所述第二设备基于第二样本集中各样本的第一特征的特征值进行分箱得到;
使用所述第一密钥,对所述第三交换信息中各样本的第一次加密ID进行二次加密,得到第一加密集合;
基于第二交换信息中的第二次加密ID和第一加密集合中的第二次加密ID,确定第一样本集和第二样本集的共有样本;
基于共有样本中各样本的标签、所在第一分箱的标识,确定所述第一特征的信息价值,用以针对机器学习模型进行特征选择。
2.根据权利要求1所述的方法,其中,所述方法还包括:
在向第二设备发送第一交换信息之前,基于第一样本集中各样本的第二特征的特征值,将第一样本集分成多个第二分箱,并将第一样本集中每一个样本所在第二分箱的标识包括在所述第一交换信息中;
在得到所述第一加密集合之后,扰乱第二样本集中各样本的相对顺序,得到第四交换信息;
向所述第二设备发送所述第四交换信息,以便所述第二设备基于所述第四交换信息中的第二次加密ID和第二加密集合中的第二次加密ID确定共有样本,并基于共有样本中各样本的标签、所在第二分箱的标识,确定所述第二特征的信息价值,其中第二加密集合是使用所述第二密钥对所述第一交换信息中的第一次加密ID进行二次加密得到的。
3.根据权利要求2所述的方法,其中,所述基于第一样本集中各样本的第二特征的特征值,将第一样本集分成多个第二分箱包括:
根据等频分箱、等距分箱、卡方分箱中任一项,将第一样本集分成所述多个第二分箱。
4.根据权利要求1所述的方法,其中,第一样本集中各样本的初始ID和第二样本集中各样本的初始ID均为正整数;在使用第一密钥对第一样本集中各样本的初始ID进行加密之前,所述方法还包括:
确定大于第一样本集中各样本的初始ID中最大初始ID,且大于第二样本集中各样本的初始ID中最大初始ID的第一质数;
确定与第一质数互质的第一正整数为所述第一密钥。
5.根据权利要求4所述的方法,其中,所述使用第一密钥对第一样本集中各样本的初始ID进行加密,得到第一样本集中各样本的第一次加密ID包括:
对于第一样本集中每一个样本,确定该样本初始ID和所述第一密钥的乘积除以所述第一质数的余数为该样本的第一次加密ID。
6.根据权利要求1所述的方法,其中,第一样本集包括标签为正的多个样本和标签为负的多个样本;所述基于共有样本中各样本的标签、所在第一分箱的标识,确定所述第一特征的信息价值包括:
确定共有样本中落入具有第一标识的第一分箱中且标签为正的样本个数,相对于共有样本中标签为正的样本总个数的第一比例;
确定共有样本中落入所述具有第一标识的第一分箱中且标签为负的样本个数,相对于共有样本中标签为负的样本总个数的第二比例;
基于各个标识的第一分箱分别对应的所述第一比例,和所述第二比例,确定共有样本的第一特征的信息价值。
7.根据权利要求1所述的方法,其中,所述第一样本集中的样本包括用户样本,所述机器学习模型为用户分类模型;或者,
所述第一样本集中的样本包括业务样本,所述机器学习模型为业务处理模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911269227.5/1.html,转载请声明来源钻瓜专利网。





