[发明专利]一种非交互式隐私保护多方机器学习方法有效
申请号: | 202010092237.2 | 申请日: | 2020-02-14 |
公开(公告)号: | CN111260081B | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 李进;李同;向晓宇 | 申请(专利权)人: | 广州大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/60 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 林梅繁 |
地址: | 510006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交互式 隐私 保护 多方 机器 学习方法 | ||
本发明属于计算机安全领域,为非交互式隐私保护的多方机器学习方法,构建了包括数据属主、数据服务提供者和训练者的架构;数据服务提供者生成公共参数,并初始化具有安全参数的公钥加密方案,为每个数据属主生成私钥与公钥密钥对,每一个训练者生成加密密钥对;数据属主对其数据集中的每一个记录使用公钥加密方案进行加密,数据属主将加密的数据集上传给训练者;在训练者与数据服务提供者之间运行若干训练轮隐私保护训练协议,得到训练完成的机器学习分类器模型,数据服务提供者无法以明文的形式揭示机器学习分类器模型的内容。本发明在保证数据属主的数据隐私的基础上,减少数据属主因为频繁交互产生的通信和计算开销。
技术领域
本发明属于计算机安全领域,具体涉及一种非交互式隐私保护的多方机器学习方法。
背景技术
隐私数据的多方机器学习技术与联邦学习技术在实际应用中取得了很好的效果。这些有关隐私保护机器学习的工作面向许多流行的机器学习模型,例如随机决策树、朴素贝叶斯分类、k-均值聚类、神经网络等。但是,这些解决方案中并未考虑数据属主和训练者的安全需求。尽管数据属主(如持有健康记录的患者)未必具有参与训练的需求与客观条件,这些方案还是要求数据属主以交互的方式参与训练,导致了数据属主必须面对频繁交互带来的高计算或通信开销的效率问题。
于2019年6月25日公开的发明专利CN109934004A,公开了一种机器学习服务系统中保护隐私的方法,包括:步骤1,学习和表达原始数据:将高维的原始数据用低维本征空间表达;步骤2,学习和表达攻击者数据:将所有具有高概率分类结果的查询数据用低维本征空间表达作为攻击者数据;步骤3,比较和判断是否回答当前查询:比较所述攻击者数据与原始数据的相似度,如果相似度大于预设的阈值,确认回答当前查询会泄露隐私,则拒绝回答当前查询,否则允许回答当前查询。该方法能保护由于多次查询带来的隐私问题,可以通过对攻击者的知识进行学习建模,进而决定回答或拒绝回答查询服务,解决了由于过度查询带来的机器学习查询服务隐私问题,由于该方法不改变模型本身,不影响服务质量。
总的来说,现有的隐私保护机器学习方法,虽然在一定程度上解决了相应的技术问题,但是需要数据属主的参与,方能完成多方机器学习任务,带来了过高的通信和计算开销问题。
发明内容
为了解决现有技术在多方机器学习任务中需要数据属主参与因而产生过高的通信和计算开销的问题,本发明提出了一种非交互式隐私保护多方机器学习方法,该方法所设计的架构在保证数据属主的数据隐私的基础上,减少了数据属主因频繁交互产生的通信和计算开销。
本发明采用如下技术方案来实现:一种非交互式隐私保护多方机器学习方法,所述方法构建了非交互式隐私保护机器学习架构,所述架构包括三种实体:
数据属主,为拥有数据集,并为机器学习分类器的训练提供训练数据,且不需要获得训练结果的实体;
数据服务提供者,为不可信的辅助服务器,在训练期间承担加密和运算操作,包括发布公共参数,向数据属主颁发加密密钥,以及与训练者合作进行训练;
训练者,从数据属主处收集数据作为训练数据集,利用该训练数据集训练并建立机器学习分类器模型;
所述方法包括以下步骤:
S1、数据服务提供者生成公共参数,并初始化具有安全参数的公钥加密方案,然后为每个数据属主生成私钥与公钥密钥对,并将公钥分发给该数据属主;每一个训练者生成加密密钥对,并公布自己的加密公钥;
S2、数据属主对自己数据集中的每一个记录使用公钥加密方案进行加密,数据属主将加密的数据集上传给训练者,训练者收集后将其作为训练数据集的一部分;
S3、在训练者与数据服务提供者之间运行若干训练轮隐私保护训练协议,最终训练者得到训练完成的机器学习分类器模型,同时数据服务提供者无法以明文的形式揭示机器学习分类器模型的内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010092237.2/2.html,转载请声明来源钻瓜专利网。