[发明专利]联邦学习模型的数据处理方法、装置及存储介质在审
申请号: | 202210080568.3 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114298327A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 陈伟敬;魏文斌;林冰垠;吴玙;范涛;徐倩 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李昂;浦彩华 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 模型 数据处理 方法 装置 存储 介质 | ||
1.一种联邦学习模型的数据处理方法,其特征在于,应用于第一参与方设备,所述方法包括:
获取所述第一参与方设备提供的用于训练所述联邦学习模型的至少一个第一特征;
接收第二参与方设备发送的至少一个匿名特征,所述匿名特征与用于训练所述联邦学习模型的第二特征相对应;
从所述第一特征以及所述匿名特征中选取至少一个特征,并获取各所述特征对应所述联邦学习模型的预测结果;
基于所述至少一个特征,构建线性模型的训练样本,并基于所述训练样本以及所述预测结果,对所述线性模型进行训练,得到所述线性模型收敛时的模型参数;
基于所述模型参数,确定各所述第一特征对应所述预测结果的第一贡献信息,以及各所述匿名特征对应所述预测结果的第二贡献信息。
2.根据权利要求1所述的方法,其特征在于,所述接收第二参与方设备发送的至少一个匿名特征,包括:
发送携带样本标识的匿名特征获取请求至所述第二参与方设备;
其中,所述样本标识用于,标识所述第一特征归属的用于训练所述联邦学习模型的样本,所述匿名特征获取请求用于,所述第二参与方设备响应所述匿名特征获取请求,确定所述样本标识对应的所述第二特征、以及所述第二特征对应的匿名特征;
接收到所述第二参与方设备返回的与所述样本标识对应的匿名特征。
3.根据权利要求1所述的方法,其特征在于,在所述基于所述模型参数,确定各所述第一特征对应所述预测结果的第一贡献信息,以及各所述匿名特征对应所述预测结果的第二贡献信息之后,所述方法包括:
将各所述第一特征对应所述预测结果的第一贡献信息,以及各所述匿名特征对应所述预测结果的第二贡献信息求和,得到汇总贡献信息;
分别获取各所述第二贡献信息与所述汇总贡献信息比值,并将所述比值发送至所述第二参与方设备,以使所述第二参与方设备基于所述比值,确定与各所述匿名特征对应的所述第二特征的贡献信息。
4.根据权利要求1所述的方法,其特征在于,所述从所述第一特征以及所述匿名特征中选取至少一个特征,包括:
构建包括所述至少一个第一特征及至少一个所述匿名特征的特征集合;
获取所述特征集合包括的特征子集;
从多个所述特征子集采样得到目标数量的目标特征子集,并将所述目标特征子集包括的特征作为选取的所述至少一个特征。
5.根据权利要求4所述的方法,其特征在于,所述从多个所述特征子集采样得到目标数量的目标特征子集,包括:
获取各所述特征子集的权重分数;
按照权重分数由大到小的顺序,对各所述特征子集进行排序,得到特征子集序列;
依据所述特征子集序列,从第一个特征子集开始顺序采样,得到目标数量的特征子集作为目标特征子集。
6.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个特征,构建线性模型的训练样本,包括:
获取所述特征与所述线性模型的训练样本间的转换关系;
基于所述转换关系,对所述至少一个特征分别进行转换,得到各所述特征对应的向量表示;
并将所述向量表示作为所述线性模型的训练样本。
7.根据权利要求1所述的方法,其特征在于,所述基于所述训练样本以及所述预测结果,对所述线性模型进行训练,得到所述线性模型收敛时的模型参数,包括:
将所述预测结果,作为相应所述训练样本的样本标签,对所述线性模型进行训练,得到所述线性模型收敛时的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210080568.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种春砂仁果醋
- 下一篇:一种滤芯便于拆卸清洗的滤筒除尘器