[发明专利]数据处理系统及方法有效
申请号: | 202110538765.0 | 申请日: | 2021-05-18 |
公开(公告)号: | CN112989399B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 郑小林;马源;胡雪 | 申请(专利权)人: | 杭州金智塔科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 310012 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理系统 方法 | ||
1.一种数据处理系统,其特征在于,包括:
至少两个特征提供端,被配置为基于本地样本特征构建特征矩阵,并将所述特征矩阵输入至加载到本地的初始化函数进行处理,获得初始预测分值;根据所述初始预测分值在所述本地样本特征中筛选出初始样本特征,并将所述初始样本特征作为初始分割节点构建初始业务树模型;基于所述初始业务树模型对所述本地样本特征对应的样本数据进行预测,并将预测结果与样本标签提供端广播的样本标签进行比较;在比较结果未满足预设条件的情况下,根据所述预测结果确定除所述初始样本特征的本地样本特征构建的特征矩阵对应的中间预测分值;基于所述初始预测分值和所述中间预测分值在除所述初始样本特征的本地样本特征中筛选出待预测样本特征,并将所述待预测样本特征对应的样本数据发送至数据加密端;
所述数据加密端,被配置为接收至少两个样本数据;通过对所述至少两个样本数据进行加密处理,获得至少两个加密样本数据;将所述至少两个加密样本数据发送至样本标签提供端;
所述样本标签提供端,被配置为根据所述至少两个加密样本数据确定目标样本特征,并将所述目标样本特征作为其所属的特征提供端的目标分割节点;在基于本地样本标签确定所述目标分割节点的分割周期满足训练停止条件的情况下,广播训练停止信息。
2.根据权利要求1所述的数据处理系统,其特征在于,所述至少两个特征提供端,进一步被配置为:
计算所述预测结果的预测值和所述样本标签的样本标签值分别对应的一阶导数向量和二阶导数向量,以及提取所述待预测样本特征对应的待处理数据;
基于所述一阶导数向量、所述二阶导数向量以及所述待处理数据组成所述待预测样本特征对应的样本数据,并发送至所述数据加密端。
3.根据权利要求2所述的数据处理系统,其特征在于,所述数据加密端,进一步被配置为:
接收所述至少两个特征提供端发送的所述至少两个样本数据;
通过采用同态加密算法对所述至少两个样本数据进行加密处理,获得所述至少两个加密样本数据;
将所述至少两个加密样本数据发送至所述样本标签提供端。
4.根据权利要求3所述的数据处理系统,其特征在于,所述样本标签提供端,进一步被配置为:
接收所述至少两个加密样本数据,并计算所述至少两个加密样本数据中各个加密样本数据对应的信息增益值;
根据所述信息增益值在所述至少两个加密样本数据中选择目标加密样本数据,并将所述目标加密样本数据对应的样本特征作为所述目标样本特征。
5.根据权利要求4所述的数据处理系统,其特征在于,所述样本标签提供端,进一步被配置为选择最高的信息增益值对应的加密样本数据作为所述目标加密样本数据,将所述目标加密样本数据发送至所述数据加密端;
所述数据加密端,进一步被配置为接收所述目标加密样本数据,并对所述目标加密样本数据进行解密获得目标样本数据;确定所述目标样本数据所属的目标特征提供端,并向所述目标特征提供端发送所述目标样本数据;
所述目标特征提供端,被配置为接收所述目标样本数据,并确定所述目标样本数据对应的所述目标样本特征;将所述目标样本特征作为所述目标分割节点,并基于所述目标分割节点对所述初始业务树模型进行更新。
6.根据权利要求1至5任意一项所述的数据处理系统,其特征在于,所述训练停止条件包括:迭代次数条件、残差值变化条件或请求停止条件。
7.根据权利要求1所述的数据处理系统,其特征在于,所述样本标签提供端,还被配置为向所述至少两个特征提供端发送建立快照请求;
所述至少两个特征提供端,还被配置为根据所述建立快照请求读取时间信息;基于所述时间信息对本地节点分割信息的数据进行保存,并根据保存结果建立哈希表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州金智塔科技有限公司,未经杭州金智塔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110538765.0/1.html,转载请声明来源钻瓜专利网。