[发明专利]深度学习自动化模型训练方法及设备有效
| 申请号: | 201810941276.8 | 申请日: | 2018-08-17 |
| 公开(公告)号: | CN109145981B | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 卢策吾;毛崇兆 | 申请(专利权)人: | 上海非夕机器人科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 甘章乖;王路丰 |
| 地址: | 201100 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 深度 学习 自动化 模型 训练 方法 设备 | ||
1.一种深度学习自动化模型训练方法,其中,该方法包括:
获取将要进行的任务,根据所述任务确定对应的验证数据集、算法模型的类型和所述算法模型的参数限制与性能要求;
根据数据集、算法模型的类型和所述算法模型的参数限制与性能要求,确认并行的训练多个算法模型后,进行多个所述算法模型的并行训练,其中,每个并行训练的算法模型进行第一预设轮次的并行训练,每个并行训练的算法模型在其前一轮次的训练结果上进行后一轮次的训练,每一轮次的训练包括多个批次的训练,每一轮次的训练中,每个并行训练的算法模型在其同一轮次的前一批次的训练结果上进行该轮次的后一批次的训练,所述并行训练中,在每个并行训练的算法模型的每个轮次后,在所述验证集数据上测试模型性能;每隔第二预设轮次后,存储每个并行训练的算法模型对应的训练得到的算法模型,其中,所述第二预设轮次小于所述第一预设轮次;每隔第三预设轮次后,根据在每个并行训练的算法模型的每个轮次后,在所述验证集数据上测试模型性能,筛选掉不合格的并行训练的算法模型,其中,所述第三预设轮次小于所述第一预设轮次;
得到尚未被筛选掉的一个或者若干个并行的训练的算法模型,根据每个未被筛选掉的并行的训练的算法模型的在每个轮次后在所述验证集数据上测试的算法模型性能,得到每个未被筛选掉的并行的训练的算法模型的历史最佳性能,获取每个未被筛选掉的并行的训练的算法模型的历史最佳性能对应的轮次中的批次区间,所述批次区间包括初始点和结束点;
以每个批次区间的初始点为开始点,在所述存储的每个并行训练的算法模型对应的训练得到的算法模型的基础上,继续训练每个批次区间对应的未被筛选掉的并行的训练的算法模型,并用所述验证集数据测试所述批次区间内每个批次的算法模型性能,得到多个最佳批次的训练得到的算法模型,比较每个最佳批次的训练得到的算法模型的性能,选择一个最佳的最佳批次的训练得到的算法模型,作为最终算法模型。
2.根据权利要求1所述的方法,其中,所述任务包括:分类、检测、分割、追踪中的任一种。
3.根据权利要求1所述的方法,其中,所述性能要求包括模型大小、模型速度和模型准确率中的一种或任意组合。
4.一种深度学习自动化模型训练装置,其中,该装置包括:
第一装置,用于获取将要进行的任务,根据所述任务确定对应的验证数据集、算法模型的类型和所述算法模型的参数限制与性能要求;
第二装置,用于根据数据集、算法模型的类型和所述算法模型的参数限制与性能要求,确认并行的训练多个算法模型后,进行多个所述算法模型的并行训练,其中,每个并行训练的算法模型进行第一预设轮次的并行训练,每个并行训练的算法模型在其前一轮次的训练结果上进行后一轮次的训练,每一轮次的训练包括多个批次的训练,每一轮次的训练中,每个并行训练的算法模型在其同一轮次的前一批次的训练结果上进行该轮次的后一批次的训练,所述并行训练中,在每个并行训练的算法模型的每个轮次后,在所述验证集数据上测试模型性能;每隔第二预设轮次后,存储每个并行训练的算法模型对应的训练得到的算法模型,其中,所述第二预设轮次小于所述第一预设轮次;每隔第三预设轮次后,根据在每个并行训练的算法模型的每个轮次后,在所述验证集数据上测试模型性能,筛选掉不合格的并行训练的算法模型,其中,所述第三预设轮次小于所述第一预设轮次;
第三装置,用于得到尚未被筛选掉的一个或者若干个并行的训练的算法模型,根据每个未被筛选掉的并行的训练的算法模型的在每个轮次后在所述验证集数据上测试的算法模型性能,得到每个未被筛选掉的并行的训练的算法模型的历史最佳性能,获取每个未被筛选掉的并行的训练的算法模型的历史最佳性能对应的轮次中的批次区间,所述批次区间包括初始点和结束点;
第四装置,用于以每个批次区间的初始点为开始点,在所述存储的每个并行训练的算法模型对应的训练得到的算法模型的基础上,继续训练每个批次区间对应的未被筛选掉的并行的训练的算法模型,并用所述验证集数据测试所述批次区间内每个批次的算法模型性能,得到多个最佳批次的训练得到的算法模型,比较每个最佳批次的训练得到的算法模型的性能,选择一个最佳的最佳批次的训练得到的算法模型,作为最终算法模型。
5.根据权利要求4所述的装置,其中,所述任务包括:分类、检测、分割、追踪中的任一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海非夕机器人科技有限公司,未经上海非夕机器人科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810941276.8/1.html,转载请声明来源钻瓜专利网。





