[发明专利]一种基于区块链的联邦学习系统有效
| 申请号: | 202110973124.8 | 申请日: | 2021-08-24 |
| 公开(公告)号: | CN113420335B | 公开(公告)日: | 2021-11-12 |
| 发明(设计)人: | 张金琳;高航;俞学劢 | 申请(专利权)人: | 浙江数秦科技有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06Q20/38;G06Q20/40;G06Q40/02;G06Q40/04;G06N20/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 311121 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 区块 联邦 学习 系统 | ||
本发明涉及区块链技术领域,具体涉及一种基于区块链的联邦学习系统,包括:接收节点,接收目标模型及预付代币,接收数据源方提供的数据字段组成、数据行哈希值;若干个保留节点;协作节点,撮合目标模型和训练数据行;服务节点,创建联邦学习任务并上传区块链存储,保留节点将数据代入目标模型获得中间结果,将中间结果发送给服务节点,服务节点汇总全部中间结果获得目标模型的预测结果,计算损失值并公布,若干个保留节点更新目标模型,若干个保留节点重新将数据代入更新后的目标模型,直到得出的损失值小于预设阈值,服务节点发放奖励。本发明的实质性效果是:激励数据源方参与联邦学习,确保数据隐私安全,提高联邦学习的效率。
技术领域
本发明涉及区块链技术领域,具体涉及一种基于区块链的联邦学习系统。
背景技术
数据是机器学习的基础。然而在大多数行业中,由于行业竞争、隐私安全、行政手续复杂等问题,数据常常是以孤岛的形式存在的。在不同机构或企业之间实现数据集中整合也面临着重重阻力。要将分散在各地、各个机构的数据进行整合的难度是十分巨大的。谷歌在2016年提出了针对手机终端的联邦学习。联邦学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。参与联邦学习的各方地位平等,联合建模后模型各自在本地运行。经过联邦学习联合建模后,模型具有更好的准确度。目前联邦学习主要针对神经网络模型的联合建模,如卷积神经网络模型。然而目前的联邦学习系统需要多次加密中间结果并传递,导致联合学习的效率较低。虽然目前联邦学习能够实现多个数据源数据的联合应用,但参与联邦学习的各方都有机器学习模型训练的需求。对于仅拥有数据,但不需要建立机器学习模型的数据源方而言,参与联邦学习并不会获得任何收益,因而没有积极性参与联邦学习。导致联邦学习的适用范围较窄。
中国专利CN111212110A,公开日2020年5月29日,公开了一种基于区块链的联邦学习系统及方法,一种基于区块链的联邦学习系统及方法,系统包括:模型训练模块,用于联邦学习过程的机器学习模型更新和机器学习模型变化值聚合;基于区块链技术的智能合约模块,用于在联邦学习的过程中提供去中心化的控制功能与密钥管理功能;基于IPFS协议的存储模块,用于为联邦学习过程中的中间信息提供去中心化的信息存储机制;每个参与联邦学习的节点上同时运行模型训练模块、基于区块链技术的智能合约模块、基于IPFS协议的存储模块。其技术方案实现去中心化,任何节点的故障和退出都不会影响其他节点继续进行联邦学习,具有更强的鲁棒性。但其不能解决联邦学习效率低的问题。
发明内容
本发明要解决的技术问题是:目前的联邦学习的适用范围较窄的技术问题。提出了一种基于区块链的联邦学习系统,能够鼓励更多数据源方参与到联邦学习中。
为解决上述技术问题,本发明所采取的技术方案为:一种基于区块链的联邦学习系统,包括:接收节点,接收待训练的联邦学习目标模型及预付代币,分配模型编号,接收数据源方提供的数据字段组成、数据行哈希值,分配字段编号和行编号;若干个保留节点,建立在数据源方,获得数据源方的数据行及对应的字段编号和行编号;协作节点,与接收节点连接,将目标模型的输入字段及标签字段与数据行的字段组成对比,撮合目标模型和训练数据行,将模型编号以及训练数据行的行编号发送给数据源方的保留节点;服务节点,与保留节点和协作节点连接,所述保留节点得到数据源方的授权后,通知服务节点创建联邦学习任务,所述联邦学习任务包括模型编号、行编号、参与的数据源方标识及对应的奖励,所述服务节点将所述联邦学习任务上传区块链存储,将目标模型发送给对应的保留节点,所述保留节点将数据代入目标模型获得中间结果,将中间结果发送给服务节点,服务节点汇总全部中间结果获得目标模型的预测结果,将预测结果汇总发送给拥有标签的保留节点,计算损失值并公布,若干个保留节点按梯度更新目标模型,若干个所述保留节点重新将数据代入更新后的目标模型,直到得出的损失值小于预设阈值,所述服务节点发放奖励,将发放结果上传区块链存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江数秦科技有限公司,未经浙江数秦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110973124.8/2.html,转载请声明来源钻瓜专利网。





