[发明专利]一种激励驱动的区块链联邦学习方法在审
申请号: | 202110894759.9 | 申请日: | 2021-08-05 |
公开(公告)号: | CN113657608A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 寿黎但;陈珂;江大伟;应益龙;董大捷;张哲槟;张俊;马宇航 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/60;G06F16/27;G06F16/182 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 激励 驱动 区块 联邦 学习方法 | ||
1.一种激励驱动的区块链联邦学习方法,其特征在于:联邦学习任务参与节点包括任务发布节点、训练节点和验证节点,该方法的步骤如下:
(1)任务发布节点根据需要在区块链发布智能合约,上传满足训练模型和验证模型效果所需文件的文件句柄,并向智能合约转入必要的数字货币作为激励,同时开始招募训练节点和验证节点。
(2)训练节点和验证节点访问区块链,获取处在招募状态的智能合约,结合任务需求和自身条件,向有意向的智能合约报名,申请参与训练过程或验证过程。
(3)待训练节点和验证节点的招募完成后,每个训练节点从智能合约获取任务发布节点提供的全局模型的拓扑结构与参数文件的文件句柄,从可信分布式文件系统中下载具体文件,使用本地数据集完成模型训练,获得本地模型,训练节点将加密后的本地模型文件存入可信分布式文件系统,将对应文件句柄上传至智能合约。
(4)待所有训练节点完成训练后,每个验证节点从智能合约获取任务发布节点提供的验证集文件及所有训练节点的本地模型参数文件的文件句柄,从可信分布式文件系统中下载具体文件,评估训练节点模型效果,并聚合所有合格的模型作为下一轮的全局模型,将聚合模型参数文件存入可信分布式文件系统,将对应文件句柄和训练节点模型效果上传至对应的智能合约。
(5)待所有验证节点完成验证后,智能合约比对所有验证节点的评估结果,从而确定最终结果。
(6)智能合约根据本地模型效果向对应训练节点分发数字货币作为奖励,并向符合最终结果的验证节点发放数字货币作为奖励。
(7)重复上述步骤3至步骤6,直到达到目标轮数。
2.根据权利要求1所述的一种抵抗消极联邦学习的区块链激励方法,其特征在于:所述步骤1具体为:任务发布节点向可信的分布式文件系统中上传初始化的全局模型、任务描述文件以及验证集,获得可信的分布式文件系统返回的文件句柄,连同联邦学习任务参数一起创建相应的任务智能合约并部署在区块链上,并且向该合约汇入一定量的数字货币作为激励。所述联邦学习任务参数包括:招募的训练节点和验证节点数目,训练轮次,每轮训练结束后给训练节点和验证节点所发放的数字货币总额。
3.根据权利要求1所述的一种抵抗消极联邦学习的区块链激励方法,其特征在于:所述步骤4具体为:验证节点根据任务发布节点发布的验证集,基于边际损失来计算每个本地模型与全聚合模型相比的性能损失,以此衡量贡献的大小,并以此为依据进行激励的发放。
4.根据权利要求3所述的一种抵抗消极联邦学习的区块链激励方法,其特征在于:所述步骤4包括以下步骤:
(4.1)首先在验证集D上计算其中表示损失函数,反应了训练节点的数据质量;wi表示训练节点i的本地模型更新;
(4.2)待所有本地模型都进行评估后,通过来筛选出效果达到预期的模型,∈为任务描述文件指定模型合格阈值;
(4.3)根据公式获得所有训练节点模型的聚合模型,再根据公式获得排除训练节点j的聚合模型,并通过计算训练节点j在本轮训练中的贡献,以作为后续训练节点奖励分发以及选择合格本地模型的依据。其中ni,n分别为节点i的数据量以及全部节点的数据总量。
5.根据权力要求4所述的一种抵抗联邦学习恶意节点攻击的区块链审计方法,其特征在于:所述步骤5具体为:智能合约根据设定的阈值剔除不合格的本地模型,并聚合所有合格的模型作为下一轮的全局模型,以此来去除恶意的训练节点;所有验证节点在上传结果后,智能合约从招募到的验证节点中选择奇数个节点组成审计委员会,验证节点被选中的概率与其在区块链上的资产成正比;在审计阶段,取审计委员会中占比最多的评估结果为最终结果。
6.根据权力要求4所述的一种抵抗联邦学习恶意节点攻击的区块链审计方法,其特征在于:所述步骤6具体为:
(6.1)智能合约根据步骤(4)中所计算的贡献分发本轮总训练节点奖励Rw,贡献反映合格训练节点i的数据质量;因此,训练节点奖励分发公式如下:
(6.2)智能合约会给提供与最终验证结果一致的验证节点分发本轮总验证节点奖励,分为基本奖励Pbase×Rv和额外奖励Pbouns×Rv。所有评估结果与最终评估结果一致的验证节点都将获得基本收益,另外,被选为审查委员会成员的验证节点还将获得额外收益。因此,验证节点奖励分发公式如下:
其中,n代表所有合格的验证节点数目,ncommitee代表所有合格的审查委员会成员数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110894759.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向联邦学习的连续学习方法
- 下一篇:一种蒸馏系统