[发明专利]多方安全计算、学习模型的训练方法、系统、设备及介质在审

专利信息
申请号: 202310348364.8 申请日: 2023-04-04
公开(公告)号: CN116127495A 公开(公告)日: 2023-05-16
发明(设计)人: 尤志强;卞阳;王兆凯;赵东;陈立峰;张伟奇 申请(专利权)人: 富算科技(上海)有限公司
主分类号: G06F21/60 分类号: G06F21/60;G06F21/62;G06F17/16;G06F18/23;G06N20/20
代理公司: 上海弼兴律师事务所 31283 代理人: 林嵩;罗朗
地址: 200135 上海市浦东新区*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多方 安全 计算 学习 模型 训练 方法 系统 设备 介质
【说明书】:

发明公开了一种多方安全计算、学习模型的训练方法、系统、设备及介质,其中多方安全计算包括分别获取发起方对应的第一特征矩阵与参与方对应的第二特征矩阵;对第二特征矩阵中的每个特征进行随机预聚类压缩处理得到对应的聚类矩阵和聚类索引;基于聚类矩阵构建稀疏矩阵,基于聚类索引对第一特征矩阵进行预聚合计算得到聚合矩阵;对稀疏矩阵进行碎片化处理得到第一碎片矩阵,对聚合矩阵进行碎片化处理得到第二碎片矩阵;基于每个特征对应的第一碎片矩阵和第二碎片矩阵进行多方安全计算以得到多方安全计算结果,通过随机选取聚类中心的方式进行数据压缩,不仅在实现压缩数据的同时,还能够保证了数据的安全性,提高了计算效率。

技术领域

本发明涉及多方安全计算的技术领域,特别涉及一种多方安全计算、学习模型的训练方法、系统、设备及介质。

背景技术

随着人工智能技术的发展,人们为解决数据孤岛的问题,提出了“联邦学习”的概念,联邦学习本质上是一种分布式机器学习框架,其做到了在保障数据隐私安全及合法合规的基础上,实现数据共享,共同建模。它的核心思想是在多个数据源共同参与模型训练时,不需要进行原始数据流转的前提下,仅通过交互模型中间参数进行模型联合训练,原始数据可以不出本地。这种方式实现数据隐私保护和数据共享分析的平衡,即“数据可用不可见”的数据应用模式。

联邦学习中的发起方和参与方作为成员方,在不用给出己方数据的情况下,也可进行模型训练得到模型参数,并且可以避免数据隐私泄露的问题。由于联邦学习过程需要大量的数据来支持,而数据又大都分布于不同的数据持有方,所以需要联合各个数据持有方来进行模型构建。

XGBoost(Exterme Gradient Boosting)全称为极限梯度提升树模型,是一种基于决策树的集成机器学习算法,因其模型预测能力强,在工业界被广泛使用,比如应用在广告推荐、金融风控等业务场景。然而将该算法应用于联邦学习场景,由于对该算法的联邦化设计目前还处于不成熟阶段,普遍来说当前的联邦学习XGBoost算法训练的通信量比较大,导致训练耗时过长,不能满足业界需求。

发明内容

本发明要解决的技术问题是为了克服现有技术中的联邦学习模型训练耗时长、效率低的缺陷,提供一种多方安全计算、学习模型的训练方法、系统、设备及介质。

本发明是通过下述技术方案来解决上述技术问题:

本发明提供一种多方安全计算方法,应用于至少一个发起方与至少一个参与方之间数据共享场景中,所述方法包括:

分别获取所述发起方对应的第一特征矩阵与所述参与方对应的第二特征矩阵;

对所述第二特征矩阵中的每个特征进行随机预聚类压缩处理得到对应的聚类矩阵和聚类索引;

基于所述聚类矩阵构建稀疏矩阵,基于所述聚类索引对所述第一特征矩阵进行预聚合计算得到聚合矩阵;

对所述稀疏矩阵进行碎片化处理得到第一碎片矩阵,对所述聚合矩阵进行碎片化处理得到第二碎片矩阵;

基于每个所述特征对应的所述第一碎片矩阵和所述第二碎片矩阵进行多方安全计算以得到多方安全计算结果。

较佳地,所述随机预聚类压缩处理的步骤,包括:

在每个所述特征中随机选取若干特征值作为该对应特征的聚类中心;

基于预设聚类规则将所述第二特征矩阵的其余特征值聚类至所述聚类中心处,以得到与各个所述聚类中心相对应的聚类矩阵和聚类索引。

较佳地,所述基于所述聚类矩阵构建稀疏矩阵,包括:

根据所述聚类中心和预设分桶数对所述聚类矩阵中的特征进行分桶处理以得到子稀疏矩阵;

将全部的所述子稀疏矩阵进行拼接以得到所述稀疏矩阵。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富算科技(上海)有限公司,未经富算科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310348364.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top