[发明专利]一种基于联邦学习的分类方法在审
申请号: | 202110721730.0 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113344120A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 张海;卢耀宗;苏温庆 | 申请(专利权)人: | 陕西数盾慧安数据科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F21/62 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 耿路 |
地址: | 710199 陕西省西安市国家民用航天产*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联邦 学习 分类 方法 | ||
本发明涉及一种基于联邦学习的分类方法,按照如下方法进行,获取多个参与方提供的原始数据,并将该各参与方提供的原始数据上传到本地服务器中;对各参与方提供的属性数据矩阵进行数据标准化处理;对提供属性数据矩阵的参与方在本地计算中间变量;对提供标签数据向量的参与方结合标签数据向量和中间变量计算梯度中间量;根据得到的梯度中间量计算出各参与方的属性数据矩阵对应的梯度向量;更新各参与方的子分类超平面,迭代,直至达到容忍误差精度或最大迭代次数,输出最终的分类器;在联邦学习框架下学习分类器可打破数据壁垒,降低数据的汇总成本,避免数据中个体的隐私泄漏,而所学习的分类器还具有较高的可用性,可以判断出目标数据的具体类别。
技术领域
本发明属于信息技术技术领域,特别是涉及一种基于联邦学习的分类 方法。
背景技术
为充分发掘数据背后的潜在价值,传统的数据建模方法会尽可能多的 汇总各数据拥有方的数据。如银行为发现潜在贷款客户,会收集企业的工 商数据、税务数据、征信数据和历史贷款数据等,并基于汇总数据挖掘客 户潜在的贷款需求。又如医院要通过分析某种疾病患者的数据来实现该疾 病的智能诊断,受限于单家医院病例较少,会收集多家医院同类患者的数 据,并基于汇总数据研究致病机理。这种跨行业跨企业的数据合并需付出极高的成本,而且随着社会对隐私安全认知的提高,隐私安全的相关法案 逐步出台,这类传统直接交易数据的方式不再能满足隐私安全和相关法规 的要求,进而形成大量数据孤岛。
联邦学习是解决这类数据孤岛的有效方式。在联邦学习框架下,各参 与方可借助其他地方的数据进行联合建模,各方无需共享数据资源,在数 据不出本地的情况下进行数据联合训练,建立共享的机器学习模型。分类 问题是机器学习中极为重要的一类问题,为使得现有分类方法可在数据孤 岛的客观约束下挖掘数价值,提供一种基于联邦学习的分类方法。
发明内容
为解决上述问题,本发明是提供一种降低数据的汇总成本,避免数据 中个体的隐私泄漏,而所学习的分类器还具有较高的可用性的基于联邦学 习的分类方法。
一种基于联邦学习的分类方法,按照如下步骤进行:
S1.获取多个参与方提供的原始数据,并将该各参与方提供的原始数据 上传到本地服务器中;多个参与方包括一个提供属性数据矩阵和标签数据 向量的参与方和多个只提供属性数据矩阵的参与方;
S2.对各参与方提供的属性数据矩阵进行数据标准化处理,得到标准化 的属性数据矩阵;
S3.对只提供属性数据矩阵的参与方在本地计算中间变量;
S4.对提供标签数据向量的参与方结合标签数据向量和步骤S3中计算 的中间变量计算梯度中间量;
S5.根据步骤S4得到的梯度中间量在本地计算出各参与方的属性数据 矩阵对应的梯度向量;
S6.各参与方根据计算的梯度向量更新各自子分类超平面,并根据更新 的子分类超平面汇总为分类超平面;
S7.重复步骤S3-S6,直至达到容忍误差精度或最大迭代次数,输出最 终的分类器。
步骤S1中所述的参与方是3个(为3个参与方仅作为对本发明说明解释的 一种实施例,),分别为A参与方、B参与方和C参与方,所述参与方A提供属 性数据矩阵DA和标签数据向量YA,参与方B提供属性数据矩阵DB,参与方C 提供属性数据矩阵DC。
步骤S1中所述属性数据矩阵DA、DB和DC的维度分别为pA、pB和pC,DA、 DB、DC和YA具有相同的样本量n,且YA中元素的值属于{0,1};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西数盾慧安数据科技有限公司,未经陕西数盾慧安数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110721730.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种截断机抬升取片机构
- 下一篇:双斜面工件及其夹具体的加工方法