[发明专利]数据处理系统、方法和设备有效
申请号: | 201710552725.5 | 申请日: | 2017-07-07 |
公开(公告)号: | CN109214519B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 盖坤;代兴亚;胡泽林;黄岁;刘博超;宋成儒;孙鹏;王志;闫阳辉;易慧民;张雨;赵丽琴;周国睿;朱小强 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08;G06K9/62 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 吴崇 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理系统 方法 设备 | ||
1.一种数据处理系统,包括:
控制组件,以及
耦合到所述控制组件的多个计算子组件,
所述计算子组件包括一个或多个数据组件、一个或多个嵌入组件和一个或多个后端组件;
所述多个计算子组件在所述控制组件中的处理流程的指示下,分别处理样本数据集合的样本子集,对于所述多个计算子组件中的一个:
所述数据组件,用于基于所述控制组件中的处理流程,将样本数据集合的样本子集依次输出到所述嵌入组件;
所述嵌入组件,用于基于所述控制组件中的处理流程接收所述样本子集,基于映射参数,将所述样本子集中的样本数据映射到多维空间得到多维样本子集,并输出所述多维样本子集到所述后端组件;
所述后端组件,用于接收所述多维样本子集,并根据所述后端组件中存储的模型对所述多维样本子集进行模型训练。
2.根据权利要求1所述的数据处理系统,其中,所述多个计算子组件中的所述嵌入组件之间建立通信,并用于:
根据所述控制组件中的处理流程的指示,在所述计算子组件的嵌入组件之间同步所述多维样本子集的映射参数。
3.根据权利要求1所述的数据处理系统,其中,
所述后端组件还用于对所述多维样本子集进行模型训练得到梯度向量,并反馈所述梯度向量;
所述嵌入组件还用于接收所述后端组件反馈的梯度向量,根据所述梯度向量更新所述多维样本子集的映射参数。
4.根据权利要求1所述的数据处理系统,其中,
所述多个计算子组件处理的所述样本数据集合的样本子集,构成所述样本数据集合的全集。
5.根据权利要求1所述的数据处理系统,其中,
所述控制组件中的处理流程,是用户自定义的处理流程。
6.根据权利要求5所述的数据处理系统,其中,
所述多个后端组件中存储的模型包括深度学习框架TensorFlow。
7.一种数据处理方法,包括:
耦合控制组件和多个计算子组件,每个所述计算子组件包括一个或多个数据组件、一个或多个嵌入组件和一个或多个后端组件;
所述多个计算子组件在所述控制组件中的处理流程的指示下,分别处理样本数据集合的样本子集,对于所述多个计算子组件中的一个:
所述数据组件基于所述控制组件中的处理流程,将样本数据集合的样本子集依次输出到所述嵌入组件;
所述嵌入组件基于所述控制组件中的处理流程接收所述样本子集,基于映射参数,将所述样本子集中的样本数据映射到多维空间得到多维样本子集,并输出所述多维样本子集到所述后端组件;
所述后端组件接收所述多维样本子集,并根据所述后端组件中存储的模型对所述多维样本子集进行模型训练。
8.根据权利要求7所述的数据处理方法,其中,所述数据处理方法还包括:
在所述多个计算子组件中的所述嵌入组件之间建立通信;
根据所述控制组件中的处理流程的指示,在所述计算子组件的嵌入组件之间同步所述多维样本子集的映射参数。
9.根据权利要求7所述的数据处理方法,其中,所述数据处理方法还包括:
所述后端组件对所述多维样本子集进行模型训练得到梯度向量,并反馈所述梯度向量;
所述嵌入组件接收所述后端组件反馈的梯度向量,根据所述梯度向量更新所述多维样本子集的映射参数。
10.根据权利要求7所述的数据处理方法,其中,
所述多个计算子组件处理的所述样本数据集合的样本子集,构成所述样本数据集合的全集。
11.根据权利要求7所述的数据处理方法,其中,
所述控制组件中的处理流程,是用户自定义的处理流程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710552725.5/1.html,转载请声明来源钻瓜专利网。