[发明专利]深度学习自动化模型训练方法及设备有效
| 申请号: | 201810941276.8 | 申请日: | 2018-08-17 |
| 公开(公告)号: | CN109145981B | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 卢策吾;毛崇兆 | 申请(专利权)人: | 上海非夕机器人科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 甘章乖;王路丰 |
| 地址: | 201100 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明的目的是提供一种深度学习自动化模型训练方法及设备,本发明通过根据所述任务确定对应的算法模型的类型,可以在多种已知的适合算法模型中直接筛选,并通过每隔第三预设轮次后,根据每个并行训练的算法模型的每个轮次后在所述验证集数据上测试模型性能,筛选掉一个或多个不合格的所述并行训练的算法模型;获取每个未被筛选掉的并行的训练的算法模型的历史最佳性能对应的轮次中的批次区间;训练每个批次区间对应的未被筛选掉的并行的训练的算法模型,选择一个最佳的最佳批次的未被筛选掉的并行的训练的算法模型,实现在训练过程中继续阶梯性的选择算法,减少了计算资源的要求和计算的时间,降低了成本。 | ||
| 搜索关键词: | 深度 学习 自动化 模型 训练 方法 设备 | ||
【主权项】:
1.一种深度学习自动化模型训练方法,其中,该方法包括:获取将要进行的任务,根据所述任务确定对应的验证数据集、算法模型的类型和所述算法模型的参数限制与性能要求;根据数据集、算法模型的类型和所述算法模型的参数限制与性能要求,确认并行的训练多个算法模型后,进行多个所述算法模型的并行训练,其中,每个并行训练的算法模型进行第一预设轮次的并行训练,每个并行训练的算法模型在其前一轮次的训练结果上进行后一轮次的训练,每一轮次的训练包括多个批次的训练,每一轮次的训练中,每个并行训练的算法模型在其同一轮次的前一批次的训练结果上进行该轮次的后一批次的训练,所述并行训练中,在每个并行训练的算法模型的每个轮次后,在所述验证集数据上测试模型性能;每隔第二预设轮次后,存储每个并行训练的算法模型对应的训练得到算法模型,其中,所述第二预设轮次小于所述第一预设轮次;每隔第三预设轮次后,根据在每个并行训练的算法模型的每个轮次后,在所述验证集数据上测试模型性能,筛选掉不合格的并行训练的算法模型,其中,所述第三预设轮次小于所述第一预设轮次;得到尚未被筛选掉的一个或者若干个并行的训练的算法模型,根据每个未被筛选掉的并行的训练的算法模型的在每个轮次后在所述验证集数据上测试的算法模型性能,得到每个未被筛选掉的并行的训练的算法模型的历史最佳性能,获取每个未被筛选掉的并行的训练的算法模型的历史最佳性能对应的轮次中的批次区间,所述批次区间包括初始点和结束点;以每个批次区间的初始点为开始点,在所述存储的每个并行训练的算法模型对应的训练得到算法模型的基础,继续训练每个批次区间对应的未被筛选掉的并行的训练的算法模型,并用所述验证集数据测试所述批次区间内每个批次的算法模型性能,得到多个最佳批次的训练得到的算法模型,比较每个最佳批次的训练得到的算法模型的性能,选择一个最佳的最佳批次的训练得到的算法模型,作为最终算法模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海非夕机器人科技有限公司,未经上海非夕机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810941276.8/,转载请声明来源钻瓜专利网。





