[发明专利]一种基于多标签的联邦学习方法、装置和系统有效
| 申请号: | 202010251416.6 | 申请日: | 2020-04-01 |
| 公开(公告)号: | CN111160572B | 公开(公告)日: | 2020-07-17 |
| 发明(设计)人: | 陆梦倩;汲小溪;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 标签 联邦 学习方法 装置 系统 | ||
本说明书实施例提供一种基于多标签的联邦学习方法、装置和系统,该方法包括:多个机构在进行联邦学习时,可信执行环境可以获取由多个机构提供的多个标签数据组,任一标签数据组中包括多个用户的原始标签,所述多个用户中至少存在一个用户在所述多个标签数据组中的多个原始标签不一致;在获取到多个标签数据组后,利用预设的弱监督学习算法对所述多个标签数据组进行学习训练,得到统一的目标标签数据组,目标标签数据组中包括所述多个用户的目标标签;将所述目标标签数据组发送给所述多个机构,以便由所述多个机构基于所述目标标签数据组进行联邦学习。
技术领域
本文件涉及联邦学习领域,尤其涉及一种基于多标签的联邦学习方法、装置和系统。
背景技术
联邦学习(又可以称为联合学习、联盟学习)是一种机器学习框架,可以有效帮助多个机构在满足用户隐私保护和数据安全的要求下,进行数据使用和机器学习建模。
通常,多个机构在进行联邦学习时,可以基于样本的标签数据和特征数据进行学习训练,其中,样本的标签数据可以由多个机构提供。然而,由于多个机构的业务场景或对标签的定义不同等原因,多个机构提供的标签数据通常是不一致的,这样,在进行联邦学习时,将无法确定以哪个机构的标签数据为准进行学习训练。
发明内容
本说明书实施例提供一种基于多标签的联邦学习方法、装置和系统,用于解决在联邦学习中,在多个机构提供的标签数据不一致的情况下,无法确定基于哪个机构的标签数据进行学习训练的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出一种基于多标签的联邦学习方法,应用于可信执行环境,包括:
获取由多个机构提供的多个标签数据组,所述标签数据组中包括多个用户的原始标签,所述多个用户中至少存在一个用户在所述多个标签数据组中的多个原始标签不一致;
利用预设的弱监督学习算法对所述多个标签数据组进行学习训练,得到目标标签数据组,所述目标标签数据组中包括所述多个用户的目标标签;
将所述目标标签数据组发送给所述多个机构,由所述多个机构基于所述目标标签数据组进行联邦学习。
第二方面,提出一种基于多标签的联邦学习装置,应用于可信执行环境,包括:
获取单元,获取由多个机构提供的多个标签数据组,所述标签数据组中包括多个用户的原始标签,所述多个用户中至少存在一个用户在所述多个标签数据组中的多个原始标签不一致;
处理单元,利用预设的弱监督学习算法对所述多个标签数据组进行学习训练,得到目标标签数据组,所述目标标签数据组中包括所述多个用户的目标标签;
发送单元,将所述目标标签数据组发送给所述多个机构,由所述多个机构基于所述目标标签数据组进行联邦学习。
第三方面,提出一种电子设备,该电子设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,该可执行指令在被执行时使该处理器执行以下步骤:
获取由多个机构提供的多个标签数据组,所述标签数据组中包括多个用户的原始标签,所述多个用户中至少存在一个用户在所述多个标签数据组中的多个原始标签不一致;
利用预设的弱监督学习算法对所述多个标签数据组进行学习训练,得到目标标签数据组,所述目标标签数据组中包括所述多个用户的目标标签;
将所述目标标签数据组发送给所述多个机构,由所述多个机构基于所述目标标签数据组进行联邦学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010251416.6/2.html,转载请声明来源钻瓜专利网。





