[发明专利]无需第三方的隐私计算下逻辑回归训练方法、系统及装置有效

专利信息
申请号: 202211576431.3 申请日: 2022-12-09
公开(公告)号: CN115580496B 公开(公告)日: 2023-03-28
发明(设计)人: 田健;南文捷;薛瑞东 申请(专利权)人: 北京融数联智科技有限公司
主分类号: H04L9/40 分类号: H04L9/40;H04L67/10
代理公司: 北京三聚阳光知识产权代理有限公司 11250 代理人: 李博洋
地址: 100037 北京市西城*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 无需 第三 隐私 计算 逻辑 回归 训练 方法 系统 装置
【说明书】:

发明公开了一种无需第三方的隐私计算下逻辑回归训练方法、系统及装置,由发起方执行,获取第一公私钥对、标签和第一明文数据,第一公私钥对包括第一公钥和第一私钥;基于第一公钥对标签和第一明文数据进行加密得到标签加密数据和第一加密数据,将标签加密数据和第一加密数据发送至协同方,获取协同方发送的第二加密数据;基于第一明文数据、第二加密数据以及标签计算得到第一梯度密文;基于第一梯度密文和随机生成的第一随机数得到第一加盐密文,将第一加盐密文发送至协同方;获取协同方基于第一加盐密文反馈的第一加盐明文;基于第一加盐明文和第一随机数得到第一梯度信息;基于第一梯度信息更新预设的第一隐私计算模型的第一系数。

技术领域

本发明涉及隐私计算技术领域,具体涉及一种无需第三方的隐私计算下逻辑回归训练方法、系统及装置。

背景技术

在当前“人工智能”、“数据科技”的年代,数据作为最重要的生产要素之一有着大量的流通与融合的需要。当多家机构展开数据合作时,需要将各方的明文数据归集在一处(可以统一归集在其中的某一家机构,也可以归集在某个独立的第三方平台),之后再进行中心化的数量化建模或分析工作。数据有着开放与融合的需要,但是,各个机构对于自身商业数据保护的需要也都使得机构明文数据“出库”这样的操作越来越不可行。为了解决数据流通与数据安全保护这一对矛盾,隐私计算技术得到了空前的关注。

隐私计算全称是“保护数据隐私的计算”,或“隐私保护计算”(PrivacyPreserving Computation),是指在多个参与方进行联合计算的时候,在保证各方数据安全与隐私不泄露的前提下,实现计算与数据价值挖掘的技术体系。隐私计算并不是一种单一的技术,它是一套包含人工智能、分布式计算、密码与安全、数据科学等众多领域交叉融合的跨学科技术体系。隐私计算能够在各方明文数据无需出库的情况下,完成各方数据的融合计算、联合建模的等数据应用,在满足数据隐私安全的基础上,实现数据“价值”和“知识”的流动与共享,真正做到“数据可用不可见”。

目前隐私计算领域在应用层面最受广泛关注的领域是联邦学习和基于MPC的机器学习方法,而在众多的机器学习算法中,一个基础、稳定,并且可以称为是更复杂的机器学习算法中的一个基本组件的算法就是逻辑回归(Logistic Regression)。逻辑回归主要用于二元分类,同时可以拓展到多分类乃至是回归问题,在实际应用场景上分布也非常广泛。具有很强的可解释性和稳定性。而其作为神经网络的基本组成,在研究方面很具意义。大多数实际落地的隐私计算产品、学术论文等都是从逻辑回归的实现开始的。

在联邦学习框架下,双方进行逻辑回归算法的训练和部署使用是存在很高的技术门槛的,因为双方需要在保护各自本地数据的情况下进行多次逻辑回归的梯度计算乃至于多次迭代操作等。为了使得双方能够顺利的进行运算的同时还能保证数据不泄露,很多的基于联邦学习的逻辑回归算法会选择引入一个“可信第三方”的计算节点,该节点会接受双方部分的中间计算结果,然后进行运算后返回给双方。在这个过程中,“可信第三方”一般直接接触到的数据都是进行过中间加工的,不同的选择也会使得“可信第三方”能够看到的数据、信息量是有限的。

在联邦学习的框架下,需要用到各方的共同数据,“可信第三方”其实需要解密得到各方的数据已完成对该模型的更新计算,这种方法会暴露一部分中间步骤和信息,不是非常安全。而同时也有一部分算法,虽然没有“可信第三方”,但是并不能很好的保护到中间的步骤和数据,比如说有的算法选择将Z值直接以明文的形式传输等等。

同时有一些去除第三方的基于联邦学习的逻辑回归手段,利用同态加密、加盐等方式来保证中间步骤、中间交互数据的安全性,但是往往双方进行逻辑回归时的计算是不对称的,即发起方(拥有Y标签的一方)会比另一方有更多的计算步骤。

虽然第三方的存在会极大的降低联邦学习下逻辑回归算法的设计难度和实施难度,但就从实际的考量上来说,并不是很好的方法,无论是存在的安全性隐患还是不确定的计算中心、网络传输延迟等等,而不保护中间计算步骤的两方模型的安全性则是很难得到保障。不对称的两方模型虽然能解决上面提到的问题,但是却不能够合理的分配计算资源,同时存在潜在的风险隐患。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京融数联智科技有限公司,未经北京融数联智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211576431.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top