[发明专利]一种基于区块链的联邦学习数据审计系统及方法有效
申请号: | 202110315303.2 | 申请日: | 2021-03-24 |
公开(公告)号: | CN113111124B | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 孙哲;殷丽华;万俊平;胡宇;李超;李然 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/23;G06F21/60;G06F21/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;郝传鑫 |
地址: | 510006 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区块 联邦 学习 数据 审计 系统 方法 | ||
本发明公开了一种基于区块链的联邦学习数据审计系统及方法,该方法包括:模型买家发布待训练模型并设置若干测试集;数据交换节点向计算节点发放多密钥同态密钥和待训练模型;当计算节点训练完成后,使用测试集对本地梯度进行贡献度测试;各计算节点利用密钥分片计算联合密钥,并将梯度加密发送至各聚合节点;各聚合节点执行同态聚合后,使用联合密钥对聚合梯度进行解密;各聚合节点测试聚合梯度贡献度,若数值异常,则通过多次对比集合间的节点差异和贡献度差异,定位异常节点;聚合节点尝试将所有梯度密文等信息写入聚合节点内的新区块后将聚合密文发送至模型买家;当模型买家获取新的聚合梯度密文,向聚合节点购买联合私钥进行解密得到新梯度。
技术领域
本发明涉及区块链技术领域,特别是涉及一种基于区块链的联邦学习数据审计系统及方法。
背景技术
深度学习如今已在计算机视觉、自然语言处理、语音处理等领域取得了巨大的成功,通常情况下,当拥有足够多的训练数据时,深度学习模型可以取得更好的效果。联邦学习中,模型训练方将深度学习任务的模型结构分配到多个终端,由各个终端根据其拥有的本地数据对给定的深度学习模型进行训练,产生梯度并将其上传至聚合节点,得出深度学习模型的聚合梯度以更新训练方的模型。通过这种方法,可以促使多个数据拥有方合作进行同一训练,来缓解深度学习中模型训练方数据不足的问题,但是这种多个数据拥有方合作进行同一训练的方法在梯度交换中可能会存在隐私泄露问题。
为了解决梯度交换中的隐私泄露问题,公开号为CN111552986B的中国专利申请中提出了一种基于区块链的联邦建模方法,其基于区块链的去中心化特点,使用同态加密解决了联邦学习中的梯度隐私泄露问题。然而,该方案中仅审计了训练数据的正确性,鉴于梯度密文数据的实际意义是未知的,联邦学习中应用的同态加密可能导致参与者的恶意行为,若参与方声称上传好梯度,实际却上传差梯度时,将会对梯度接收方造成欺骗,损害联邦学习模型。公开号为CN111797142A的中国专利申请中提供了一种基于区块链上智能合约的实时审计方案,该方案中,审计方可以通过对比数据以验证链上数据的真实可信,但需要一定的交互流程。
综上所述,现有技术联邦学习数据审计方法普遍存在的问题在于:1)密文数据的优劣性难以考察,参与方可能有恶意行为;2)审计过程多为交互过程,给审计带来了较大的工作量。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于区块链的联邦学习数据审计系统及方法,可以非交互地进行数据审计过程,防止恶意行为,使得联邦学习中的任何参与方如果有恶意行为,上传不良的梯度密文,都会在审计过程中被发现,同时,本发明的审计过程无需额外的交互过程,节省了联邦学习的工作量。
为达上述目的,本发明提出一种基于区块链的联邦学习数据审计系统,包括:
模型买家,发布待训练模型参数和训练任务需求至其所拥有的数据交换节点,并在数据交换节点设置若干测试集;当模型买家从某聚合节点获取新的聚合梯度密文,向聚合节点购买联合私钥用于解密聚合梯度密文,得到新梯度用于更新模型;
数据交换节点,存储模型买家提供的待训练模型参数,并设置测试集;在收到计算节点的注册申请后,向计算节点发放多密钥同态加密的公钥和私钥,并在计算节点申请参与训练时发放待训练模型;
若干计算节点,各计算节点经过身份认证后,向数据交换节点注册,获得多密钥同态加密的公钥和私钥,并请求模型参数进行训练,根据获得的模型和自带的本地数据,对获得的模型进行训练,获得梯度,并对本地梯度进行测试,获取本地贡献度,并记录下测试集的标识符;与其他已完成训练且有相同测试集标识符的若干计算节点组成一个集合,并求出该集合的部分子集,根据每个节点的私钥分片计算出该集合及其部分子集对应的联合私钥并在本地保存;使用加密公钥对梯度消息进行同态加密后,将密文、本地贡献度、标识符和联合私钥传输至包含聚合节点的联盟链;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110315303.2/2.html,转载请声明来源钻瓜专利网。