[发明专利]基于联邦学习的多方联合建模方法、设备和介质在审
| 申请号: | 202010130585.4 | 申请日: | 2020-02-28 |
| 公开(公告)号: | CN111368901A | 公开(公告)日: | 2020-07-03 |
| 发明(设计)人: | 马国强;范涛;魏文斌;谭明超;郑会钿;陈天健;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 联邦 学习 多方 联合 建模 方法 设备 介质 | ||
本申请公开了一种基于联邦学习的多方联合建模方法、设备和介质,所述基于联邦学习的多方联合建模方法包括:与所述第一设备关联的各第二设备进行样本对齐,获得第一样本数据,基于所述第一样本数据,通过与各所述第二设备进行交互以进行纵向联邦,计算特征分裂增益直方图,以构建联合建模决策树。本申请解决了纵向联邦建模算法模型构建时计算效率低的技术问题。
技术领域
本申请涉及金融科技(Fintech)的机器学习技术领域,尤其涉及一种基于联邦学习的多方联合建模方法、设备和介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术
(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机软件和人工智能的不断发展,机器学习建模的应用也越来越广泛,其中GBDT(Gradient Boosting Decision Tree,梯度提升迭代决策树)算法常常被用于风控、推荐等应用场景中的纵向联邦学习,目前,随着联邦学习技术的出现,可以通过利用多方的数据来建立共同的机器学习模型,以增强模型效果和更充分地使用数据,而现有的纵向GBDT联邦建模算法可支持一个数据提供方和一个数据使用方进行双方交互以进行联合建模,但是,一个数据提供方和一个数据使用方的数据量往往是较少的,并不利于纵向GBDT联邦建模算法模型快速、高效的学习到样本的模式分布,导致样本数据利用不充分和捕捉样本标签的模式分布不充分,进而导致在构建算法模型时需要的构建时间更长,需要消耗的系统计算资源更多且模型构建算法效果不满足现实建模需求,进而导致构建算法模型时的计算效率极低,所以,现有技术中存在纵向联邦建模算法模型构建时计算效率低的技术问题。
发明内容
本申请的主要目的在于提供一种基于联邦学习的多方联合建模方法、设备和介质,旨在解决现有技术中纵向联邦建模算法模型构建时计算效率低的技术问题。
为实现上述目的,本申请提供一种基于联邦学习的多方联合建模方法,所述基于联邦学习的多方联合建模方法应用于基于联邦学习的多方联合建模设备,所述基于联邦学习的多方联合建模方法包括:
与所述第一设备关联的各第二设备进行样本对齐,获得第一样本数据;
基于所述第一样本数据,通过与各所述第二设备进行交互以进行纵向联邦,计算特征分裂增益直方图,以构建联合建模决策树。
可选地,所述基于所述第一样本数据,通过与各所述第二设备进行交互以进行纵向联邦,计算特征分裂增益直方图,以构建联合建模决策树的步骤包括:
对所述第一样本数据进行特征分箱,获得第一特征分箱数据,并生成所述纵向联邦对应的密钥对;
获取模型残差和所述第一特征分箱数据对应的数据标签,并基于所述模型残差和所述数据标签计算所述第一特征分箱数据对应的一阶梯度集合和二阶梯度集合;
基于所述一阶梯度集合和所述二阶梯度集合,通过与各所述第二设备进行交互以进行纵向联邦,计算所述特征分裂增益直方图,以构建联合建模决策树。
可选地,所述特征分裂增益直方图包括第一特征分裂增益直方图和第二特征分裂增益直方图,
所述基于所述一阶梯度集合和所述二阶梯度集合,通过与各所述第二设备进行交互以进行纵向联邦,计算所述特征增益直方图,以构建联合建模决策树的步骤包括:
获取所述第一特征分箱数据对应的待分裂节点队列,并获取所述第一特征分箱数据对应的待分裂节点队列,基于所述一阶梯度集合、所述二阶梯度集合和所述待分裂节点的队首元素,计算所述第一特征分裂增益直方图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010130585.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:命名实体识别方法及装置
- 下一篇:显示背板、显示屏和电子设备





