[发明专利]联邦迁移学习的数据处理方法、装置、设备及存储介质在审
| 申请号: | 202011393430.6 | 申请日: | 2020-12-02 |
| 公开(公告)号: | CN112381236A | 公开(公告)日: | 2021-02-19 |
| 发明(设计)人: | 康焱;刘洋 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 联邦 迁移 学习 数据处理 方法 装置 设备 存储 介质 | ||
本发明公开了一种联邦迁移学习的数据处理方法、装置、设备及存储介质,其中,方法包括:通过第一样本、第二样本以及多个特征提取模型,确定各个第一特征提取模型;基于所述第一样本、第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;基于所述第二样本、第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。本发明能够通过联邦迁移学习得到兼顾模型迁移和模型可解释的目标模型,通过目标特征提取模型对样本的知识进行迁移,实现了基于不同参与方的样本数据联邦构建模型,减少训练后的模型达到目标性能的时间耗费,提升计算机算力资源的利用率。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种联邦迁移学习的数据处理方法、装置、设备及存储介质。
背景技术
机器学习在大量标记的数据上进行监督式训练可以获得很好的性能和效果,然而大型的标记数据集在数量和应用领域方面均有限,且手动标记足量的训练数据往往需要高昂的代价。针对这一问题,通常采用迁移学习方法解决,即训练一个鉴别器用于调整迁移学习网络的参数,使得参数调整后的迁移学习网络下,源领域的数据与目标领域的数据间的分布偏移减小,从而迁移学习网络应用目标领域完成目标任务时有较佳的效果。
但是,深度学习模型的缺乏可解释性使其在要求模型可解释性的应用中(比如,金融风险控制)很难被用于迁移学习,而复杂度低的深度学习模型从原始数据中学习到可迁移知识的能力较弱,因此其迁移能力不强。这就产生了一个矛盾,迁移能力强的深度学习模型缺乏可解释性,可解释性强的深度学习模型迁移能力不强,导致深度学习模型无法兼顾可解释性以及迁移能力。同时,目前不同的用户数据存储在不同数据持有方或者参与方的服务器上,出于对用户数据的隐私保护,不同服务器之间不能直接进行用户数据的交互,即各服务器之间不能共享各自的用户数据以进行联合建模,进而导致各服务器只能基于少量的用户数据进行建模,致使需要训练更长时间才能使得训练后的模型达到目标性能,进而导致计算机需要耗费大量资源算力,致使计算机算力资源的利用率低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种联邦迁移学习的数据处理方法、装置、设备及存储介质,旨在解决深度学习模型无法兼顾可解释性以及迁移能力,以及不同参与方之间不能直接进行时序数据的交互而导致计算机算力资源的利用率低的技术问题。
为实现上述目的,本发明提供一种联邦迁移学习的数据处理方法,所述联邦迁移学习的数据处理方法包括以下步骤:
通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型;
基于所述第一样本、第二参与方中第一业务场景对应的第三样本、待训练预测模型以及第一特征提取模型,确定训练后的预测模型以及各个第二特征提取模型;
基于所述第二样本、第三参与方中第二业务场景对应的第四样本、训练后的预测模型以及第二特征提取模型,确定目标预测模型以及各个目标特征提取模型。
进一步地,所述通过第一参与方基于第一参与方中第一业务场景对应的第一样本、第二业务场景对应的第二样本以及多个特征提取模型,确定各个第一特征提取模型的步骤包括:
通过第一参与方基于预设业务需求对第一样本的特征进行分组,以获得预设数量的第一样本特征组,并基于预设业务需求对第二样本的特征进行分组,以获得预设数量的第二样本特征组;
通过第一参与方通过预设数量的特征提取模型获取各个第一样本特征组对应的第一特征表征,以及各个第二样本特征组对应的第二特征表征;
通过第一参与方基于第一特征表征以及其对应的领域区分模型,确定多个第一领域区分损失值,基于各个第一领域区分损失值以及对应的特征提取模型,确定各个第三特征提取模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011393430.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全自动桑蚕养殖设备
- 下一篇:一种皮肤病临床治疗用熏蒸装置





