[发明专利]多方联合对隐私数据进行显著性检验的方法和装置有效
| 申请号: | 202010307722.7 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111506922B | 公开(公告)日: | 2023-03-10 |
| 发明(设计)人: | 刘颖婷;陈超超;王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06N20/00 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多方 联合 隐私 数据 进行 显著 检验 方法 装置 | ||
本说明书实施例提供一种多方联合对隐私数据进行显著性检验的方法和装置,隐私数据分布在M个持有方中,M个持有方各自的原始矩阵能假定构成联合矩阵,联合矩阵对应于N个业务对象针对D项属性项的属性值构成的矩阵,检验方在获取到N个业务对象对应的N个预测值以及D项属性项对应的D个模型参数时,将对N个预测值的预定计算结果作为对角元素构建N*N维的预测值矩阵,利用秘密共享的矩阵乘法SMM,基于预测值矩阵以及M个持有方各自的原始矩阵进行乘操作,得到多个子矩阵,并构建中间矩阵,将中间矩阵的逆矩阵确定为预测值矩阵与联合矩阵形成的D*D维的方差协方差矩阵;基于方差协方差矩阵的对角元素,采用显著性检验法,确定属性项的显著性水平值。
技术领域
本说明书一个或多个实施例涉及机器学习技术领域,尤其涉及多方联合对隐私数据进行显著性检验的方法和装置。
背景技术
机器学习所需要的数据往往会涉及多个平台、多个领域。例如在基于机器学习的商户分类分析场景中,电子支付平台拥有商户的交易流水数据,电子商务平台存储有商户的销售数据,银行机构拥有商户的借贷数据。数据往往以孤岛的形式存在。由于行业竞争、数据安全、用户隐私等问题,数据整合面临着很大阻力,如何在保证数据不泄露的前提下将分散在各个平台的数据整合在一起,成为一项挑战。
另一方面,随着数据量的增多,各种训练数据的维度变得越来越大。这些多维数据往往存在一些冗余信息,其可能会影响机器学习的效果,降低模型的稳定性。因此,常常需要对多维样本特征进行降维处理,在尽量不损失信息量的情况下,去掉在提升模型性能方面显著性不高的冗余特征,将其转化为低维特征。
因此,希望能有改进的方案,可以针对分布在多方中的隐私数据进行属性项的显著性检验,得到属性项在提升模型性能上的显著性水平,以便根据该显著性水平对隐私数据进行降维,同时保证隐私数据的安全不泄露。
发明内容
本说明书一个或多个实施例描述了一种多方联合对隐私数据进行显著性检验的方法和装置,以针对分布在多方中的隐私数据进行属性项的显著性检验,得到属性项在提升模型性能上的显著性水平,以便根据该显著性水平对隐私数据进行降维,同时保证隐私数据的安全不泄露。具体的技术方案如下。
第一方面,实施例提供了一种多方联合对隐私数据进行显著性检验的方法,所述隐私数据分布在M个持有方中,其中,每个持有方存储有对应的原始矩阵,所述M个持有方各自的原始矩阵在按照预定顺序相拼接的情况下构成联合矩阵,所述联合矩阵对应于N个业务对象针对D项属性项的属性值构成的矩阵;所述方法通过检验方执行,包括:
获取所述N个业务对象对应的N个预测值以及所述D项属性项对应的D个模型参数;其中,所述预测值和所述模型参数基于将所述N个业务对象的所述D项属性项的属性值作为样本特征,对逻辑回归模型进行安全联合训练后得到,所述逻辑回归模型用于对业务对象进行分类;
对所述N个预测值分别进行预定计算,将计算后的结果作为对角元素构建N*N维的预测值矩阵;
利用秘密共享的矩阵乘法SMM,基于所述预测值矩阵以及所述M个持有方各自的原始矩阵进行乘操作,得到多个子矩阵,将所述多个子矩阵构建得到中间矩阵,将所述中间矩阵的逆矩阵确定为所述预测值矩阵与所述联合矩阵形成的D*D维的方差协方差矩阵;
基于所述方差协方差矩阵的对角元素确定所述D个模型参数的标准误差;
采用显著性检验法,基于每个模型参数和对应的标准误差的比值,确定所述模型参数对应的属性项在提升所述逻辑回归模型效果上的显著性水平值。
在一种实施方式中,该方法还包括:
基于所述属性项的显著性水平值,从所有属性项中去除显著性水平值不满足预设条件的属性项,以使多个所述持有方采用去除部分属性项后的样本特征,对所述逻辑回归模型进行安全联合训练。
在一种实施方式中,所述业务对象为以下之一:用户、商户、商品、事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010307722.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于程控设备的联动系统
- 下一篇:一种青稞药渣酒及其酿造方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





