[发明专利]基于区块链的联邦学习数据参与方贡献值计算和激励方法有效
| 申请号: | 202011633318.5 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112784994B | 公开(公告)日: | 2023-03-03 |
| 发明(设计)人: | 孙凌云;王鑫;余芸;萧展辉;杨漾;邵明;陈波;敖知琪;周泽宝;任昊文;崔焱;甘杉;邹文景;孙刚;杨晓雪 | 申请(专利权)人: | 浙江大学;南方电网数字电网研究院有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F16/27;G06Q20/06 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
| 地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 区块 联邦 学习 数据 参与 贡献 计算 激励 方法 | ||
本发明公开一种基于区块链的联邦学习数据参与方贡献值计算和激励方法,该方法包括步骤:对数据参与方的本地训练模型进行特征提取,获得模型更新数据;数据需求方对所述模型更新数据解码,得到中间验证模型;数据需求方对中间验证模型分批次评估得到评估指标;根据所述评估指标计算所述数据参与方的贡献度;根据所述数据参与方的贡献度向数据参与方分配激励值;将数据参与方的激励值和地址形成奖励队列放入区块链上。本发明以由数据需求方对数据参与方的贡献进行评估和计算,再以各方贡献为分配依据进行奖励的分配,保证公平性,同时提高数据拥有方参与联邦学习的热情;有效地鼓励和吸引数据拥有方参与到联邦学习中来。
技术领域
本发明涉及联邦学习技术领域,具体涉及一种基于区块链的联邦学习数据参与方贡献值计算和激励方法。
背景技术
近几年人工智能技术快速发展,在各行各业得到了很大的应用,借助大数据环境驱动的人工智能进入了黄金发展时期。目前存在的一些潜在的问题可能造成大数据驱动的人工智能技术进入发展低谷,需要面对和解决:一是数据源的问题,包括有限的数据量和数据的质量问题。在很多行业,数据是以数据孤岛的形式存在的,行业之间甚至行业内数据的整合存在的重重障碍。二是数据隐私和数据安全问题。如何在保证数据隐私和安全的情况下有效地整合和利用数据是当前不得不面对的难题。针对这两个问题,谷歌Google在2016年提出了联邦学习(Federated Learning),有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。
联邦学习定义了机器学习框架,在此框架下通过设计虚拟模型解决不同数据拥有方在不交换数据的情况下进行协作的问题。虚拟模型是各方将数据聚合在一起的最优模型,各自区域依据模型为本地目标服务。联邦学习要求此建模结果应当无限接近传统模式,即将多个数据拥有方的数据汇聚到一处进行建模的结果。在联邦机制下,各参与者的身份和地位相同,可建立共享数据策略,由于数据不发生转移,因此不会泄露用户隐私或影响数据规范。但是传统联邦学习缺少鼓励和吸引数据拥有方参与到联邦学习中来的激励机制,为联邦学习框架引入激励机制可以有效地提高联邦学习获得信息的能力。
CN111967610 A公开了一种基于区块链的联邦学习激励方法、装置、设备及存储介质,其中,该方法包括:获取各个参与方的本地数据和本地模型;基于联邦学习框架对所有参与方的本地数据进行训练,得到联邦模型;分别计算各个本地模型的性能指数,计算联邦模型的性能指数;针对每个参与方,根据该参与方的本地模型的性能指数和联邦模型的性能指数,计算该参与方的本地数据对所述联邦学习框架的数据贡献度;根据各个参与方的数据贡献度,向各个参与方分配激励值,将相关数据存区块链上。
该方案促使参与方更加积极地为联邦学习提供数据,有利于优化联邦模型,有利于联邦学习框架的推广,该方法具有准确性、可靠性。该方法通过将参与方的数据贡献度与本地模型的性能和联邦模型的性能关联起来,而不考虑各个参与方提供数据的质量和数量,使得将数据贡献度量化问题转化为数值化、简单化。参与方的贡献度计算仅仅考虑了训练效果即模型性能,贡献度由效果评估指标(性能指数)直接导出。评估方法和奖励机制存在不准确、不公平。同时该方法中将包括联邦学习过程中的模型信息、参与方的训练后模型、测试数据以及贡献度等都存放在区块链中,因区块链的公开性,可能存在学习模型甚至数据隐私泄露的风险。
综上所述,本发明设计了一种联邦学习框架中的数据参与方贡献计算和和激励算法(即本发明所述的基于区块链技术的联邦学习数据参与方贡献计算及激励方法)。本发明认为在激励参与方时应该根据参与方所做的贡献进行分配,参与方贡献大小由其提供的数据和模型的训练效果决定,提供的数据和模型的训练效果能够较好地反映参与方的成本和贡献。引入激励手段,本发明认为相较于以往联邦学习框架,该方法能够有效地吸引数据拥有方参与到联邦学习的体系中。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;南方电网数字电网研究院有限公司,未经浙江大学;南方电网数字电网研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011633318.5/2.html,转载请声明来源钻瓜专利网。





