[发明专利]基于差分隐私进行特征处理的方法及装置有效
申请号: | 202111133642.5 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113591133B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 杜健;段普;张本宇 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06N20/20 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈婧玥;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 进行 特征 处理 方法 装置 | ||
1.一种基于差分隐私进行特征处理的方法,所述方法涉及第一方和第二方,其中第一方存储多个样本的第一特征部分,第二方存储所述多个样本的二分类标签;所述方法由所述第二方执行,包括:
对所述多个样本对应的多个二分类标签分别进行加密,得到多个加密标签;
将所述多个加密标签发送至所述第一方;
从所述第一方接收多个第一分箱中每个第一分箱对应的第一正样本加密加噪数量以及第一负样本加密加噪数量,并对其进行解密,得到对应的第一正样本加噪数量和第一负样本加噪数量;所述多个第一分箱是针对所述第一特征部分中的任一特征,对所述多个样本进行分箱处理而得到;
基于所述第一正样本加噪数量和第一负样本加噪数量,确定相对应的第一分箱的第一加噪指标;
其中,所述第一正样本加密加噪数量和第一负样本加密加噪数量的确定包括:针对所述每个第一分箱,确定其中各个样本所对应的加密标签之间的连乘结果;对所述连乘结果以及加密第一差分隐私噪声而得到的加密噪声进行乘积处理,得到所述第一正样本加密加噪数量;利用加密该第一分箱中样本的总数而得到的加密总数,减去所述第一正样本加密噪声数量,得到所述第一负样本加密加噪数量。
2.根据权利要求1所述的方法,其中,所述多个样本针对的业务对象为以下中的任一种:用户、商品、业务事件。
3.根据权利要求1所述的方法,其中,对所述多个样本对应的多个二分类标签分别进行加密,得到多个加密标签,包括:
基于同态加密算法,对所述多个二分类标签分别进行加密,得到所述多个加密标签。
4.根据权利要求1所述的方法,其中,基于所述第一正样本加噪数量和第一负样本加噪数量,确定相对应的第一分箱的第一加噪指标,包括:
对所述多个第一分箱对应的多个第一正样本加噪数量进行求和处理,得到第一正样本加噪总数;
对所述多个第一分箱对应的多个第一负样本加噪数量进行求和处理,得到第一负样本加噪总数;
基于所述第一正样本加噪总数、第一负样本加噪总数、第一正样本加噪数量、第一负样本加噪数量,确定所述第一加噪指标。
5.根据权利要求4所述的方法,所述第一加噪指标为第一加噪证据权重,其中,确定所述第一加噪指标,包括:
将所述第一正样本加噪数量除以所述第一正样本加噪总数,得到第一正样本占比;
将所述第一负样本加噪数量除以所述第一负样本加噪总数,得到第一负样本占比;
将所述第一正样本占比的取对数结果减去所述第一负样本占比的取对数结果,得到所述第一加噪证据权重。
6.根据权利要求1所述的方法,所述第二方还存储所述多个样本的第二特征部分;所述方法还包括:
针对所述第二特征部分中的任一特征,对所述多个样本进行分箱处理,得到多个第二分箱;
基于差分隐私机制,确定多个第二分箱中每个第二分箱的第二加噪指标;
其中,在确定相对应的第一分箱的第一加噪指标之后,所述方法还包括:
基于所述第一加噪指标和第二加噪指标,对所述第一特征部分和/或第二特征部分进行特征筛选处理。
7.根据权利要求6所述的方法,其中,基于差分隐私机制,确定多个第二分箱中每个第二分箱的第二加噪指标,包括:
基于所述二分类标签,确定每个第二分箱中正样本的真实数量和负样本的真实数量;
在所述正样本的真实数量和负样本的真实数量上,分别添加第二差分隐私噪声,对应得到第二正样本加噪数量和第二负样本加噪数量;
基于所述第二正样本加噪数量和第二负样本加噪数量,确定相对应的第二分箱的第二加噪指标。
8.根据权利要求7所述的方法,其中,所述第二差分隐私噪声为高斯噪声;在所述分别添加第二差分隐私噪声之前,所述方法还包括:
基于针对所述多个样本设定的隐私预算参数,以及所述第二特征部分中各个特征所对应的分箱数量,确定噪声功率;
以所述噪声功率作为高斯分布的方差,以0为均值,生成高斯噪声分布;
从所述高斯噪声分布中采样所述高斯噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111133642.5/1.html,转载请声明来源钻瓜专利网。