[发明专利]机器学习的建模方法、装置、存储介质和处理器在审
申请号: | 202110262410.3 | 申请日: | 2021-03-10 |
公开(公告)号: | CN113052322A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 刘敏;易猛;吴文杰 | 申请(专利权)人: | 广东博智林机器人有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62;G06F8/61 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 肖璐 |
地址: | 528305 广东省佛山市顺德区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 建模 方法 装置 存储 介质 处理器 | ||
1.一种机器学习的建模方法,其特征在于,包括:
获取训练数据;
依次生成多个任务节点,并根据所述任务节点创建工作流,每个所述工作流对应一个任务模型,其中,每次生成一个任务节点,均对当前任务节点之前的任务节点进行预训练,进行所述预训练所使用的预训练数据根据所述训练数据的数据类型,从所述训练数据中抽取得到,所述数据类型包括:连续变量和离散变量;
基于所述工作流对应的任务模型对所述训练数据进行训练。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述训练数据的数据类型,从所述训练数据中抽取所述预训练数据,该步骤包括:
判断所述训练数据中是否包括离散变量;
在所述训练数据中包括离散变量的情况下,对所述离散变量进行去重,并抽取去重后的离散变量参与所述训练,其中,去重后的离散变量包括每个离散变量的不同变量值;
在所述训练数据中不包括所述离散变量的情况下,抽取预设数量的连续变量参与所述训练。
3.根据权利要求1所述的方法,其特征在于,依次生成多个任务节点,包括:
接收拖动操作,其中,所述拖动操作用于将多个任务组件拖动至画布区域;
确定拖动至所述画布区域的任务组件构成所述任务节点。
4.根据权利要求3所述的方法,其特征在于,所述任务组件包括自定义算法组件,在依次生成多个任务节点,并根据所述任务节点创建工作流之前,所述方法还包括:生成自定义算法组件,其中,生成自定义算法组件的步骤包括:
获取自定义算法对应的算法镜像,其中,将自定义算法对应的代码文件打包生成所述算法镜像,所述自定义算法对应的代码文件至少包括如下至少一项:入口函数文件名、工作目录参数、算法参数、交叉验证参数、算法主体以及算法对应的任务类型;
根据所述算法镜像生成所述自定义算法组件。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将基于所述工作流对应的任务模型对所述训练数据进行训练的过程中所使用的方法进行分类;
根据每个类别的方法生成对应的功能镜像,其中,所述功能镜像至少包括:数据预处理镜像、模型训练镜像以及请求接收处理镜像。
6.根据权利要求5所述的方法,其特征在于,基于所述工作流对应的任务模型对所述训练数据进行训练,包括:
通过运行请求接收处理镜像接收前端传输的所述工作流对应的工作流信息,并通过所述请求接收处理镜像中的创建工作流接口调用所述数据预处理镜像和所述模型训练镜像;
通过所述数据预处理镜像和所述模型训练镜像创建对应的docker容器;
通过kubeflow将所述docker容器组合成工作流任务,并通过kubernetes对所述docker容器进行容器编排,以将所述工作流任务调度至对应的节点上,并基于所述工作流信息对节点进行运算。
7.根据权利要求6所述的方法,其特征在于,所述功能镜像还包括:模型部署镜像,基于所述工作流对应的任务模型对所述训练数据进行训练的步骤还包括:
通过所述请求接收处理镜像中的创建工作流接口调用所述模型部署镜像,其中,所述模型部署镜像用于将所述任务模型对外发布。
8.根据权利要求1所述的方法,其特征在于,在基于所述工作流对应的任务模型对所述训练数据进行训练之前,所述方法还包括:
调整所述工作流的超参数,获取不同超参数下所述工作流对应的任务模型的模型指标;
基于不同超参数下所述工作流对应的任务模型的模型指标选择一个超参数作为所述任务模型的超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东博智林机器人有限公司,未经广东博智林机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110262410.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:Cr12MoV钢的热处理工艺
- 下一篇:一种带有除杂功能的茶叶均匀烘干装置