[发明专利]一种基于标签重复率的联邦学习梯度防御方法在审
申请号: | 202211426095.4 | 申请日: | 2022-11-14 |
公开(公告)号: | CN116028804A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 王乐;李钊华;顾钊铨;陈光耀;张登辉 | 申请(专利权)人: | 广州大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/241;G06N3/04;G06N3/08 |
代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 覃钊雄 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 重复 联邦 学习 梯度 防御 方法 | ||
1.一种基于标签重复率的联邦学习梯度防御方法,其特征在于,包括以下步骤:
第一步:选定要参与联邦学习模型构建的本地数据集,设定置信度层个数,重复标签个数;
第二步:根据标签种类的个数,设立相应数量的标签桶,按照标签种类将本地数据集中的样本放置在对应的标签桶中,得到签分桶;
第三步:计算每个样本的置信度,根据置信度的范围,对每个标签桶中的样本进行置信度分层;
第四步:根据重复标签个数,对每个标签桶和置信度层中的样本进行组合,即每个样本组合中的样本个数等于重复标签个数,汇集所有样本组合,并打乱顺序来构成新的数据集,并将其中的样本组合都标记上“未训练”;
第五步:判断数据集中是否存在“未训练”的样本组合;
第六步:待获得参数服务器分发的最新模型,返回第五步。
2.根据权利要求1所述的一种基于标签重复率的联邦学习梯度防御方法,其特征在于:所述第二步中的每个桶只放置一种特定标签的样本。
3.根据权利要求1所述的一种基于标签重复率的联邦学习梯度防御方法,其特征在于:所述第三步的具体内容如下:
在所拥有的最新模型上,计算本地数据集中每个样本的置信度,依据置信度层个数的设定,将每个标签桶的置信度范围进行划分,构成置信度层,每个置信度层只放置符合该置信度范围内的样本,根据样本的置信度范围,将每个标签桶中的样本都放置在相应的置信度层中。
4.根据权利要求3所述的一种基于标签重复率的联邦学习梯度防御方法,其特征在于:所述置信度范围在0至1进行划分。
5.根据权利要求1所述的一种基于标签重复率的联邦学习梯度防御方法,其特征在于:所述第五步中的具体内容如下:
若数据集中还有“未训练”的样本组合,则根据批大小,从数据集中顺序地选取“未训练”的样本组合,构成待训练的批样本,利用该批样本计算对应的模型梯度,并将其上传给参数服务器,将其中的样本组合都标记上“已训练”,若数据集中没有“未训练”的样本组合,则返回第四步构建新的数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211426095.4/1.html,转载请声明来源钻瓜专利网。