[发明专利]一种面向深度学习的模型生成方法有效
| 申请号: | 202011148399.X | 申请日: | 2020-10-23 |
| 公开(公告)号: | CN112162734B | 公开(公告)日: | 2022-03-08 |
| 发明(设计)人: | 柯逍;蔡宇航;郭文忠 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06F8/20 | 分类号: | G06F8/20;G06N20/00 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 郭东亮;蔡学俊 |
| 地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 深度 学习 模型 生成 方法 | ||
1.一种面向深度学习的模型生成方法,其特征在于:包括以下步骤;
步骤S1:指定数据集,顺序组合不同深度学习框架下的数据预处理方法,形成数据预处理模块;
步骤S2:选择网络优化器,并配置其参数,形成网络优化器模块;
步骤S3:选择一种主体网络结构,所选网络结构基于不同深度学习框架实现,并配置其训练参数,形成网络结构模块;
步骤S4:拼接模型各部分模块,开始模型训练,在训练过程中不断保存最优模型,在结束后得到最终模型准确率;
所述步骤S1包括以下步骤;
步骤S11:指定深度学习任务的数据集;
步骤S12:选择一种基于深度学习框架实现下的数据预处理方式进行数据预处理,该深度学习框架包括TensorFlow或Pytorch;可选数据预处理方式包括随机水平偏移、随机垂直偏移、边缘填充或随机位置剪裁;
步骤S13:输入步骤S12指定的数据预处理方式参数,输入完毕后继续步骤S12进行循环选择或进入步骤S14;
步骤S14:顺序组合S12、S13步骤指定的基于不同深度学习框架实现下的数据预处理方式,利用数据转换适配器在不同深度学习框架算法间无缝传递,实现跨框架平台的模型构建。
2.根据权利要求1所述的一种面向深度学习的模型生成方法,其特征在于:所述步骤S2包括以下步骤;
步骤S21:选择基于网络的网络优化器,可选的网络优化器包括SGD、Adam、Adadelta或Adagrad;以损失函数反映模型的当前表现,在利用损失函数训练网络时,以网络优化器提供基于最小化损失函数的训练策略,在本步骤中,选择基于TensorFlow或PyTorch实现的网络优化器模块用于模型内部参数优化;
步骤S22:配置上述步骤选择的网络优化器的参数。
3.根据权利要求2所述的一种面向深度学习的模型生成方法,其特征在于:所述步骤S3包括以下步骤;
步骤S31:选择一种深度学习框架实现下的网络结构作为输入网络,网络结构模块可选用的网络结构包括TensorFlow或Pytorch框架实现下的Vgg系列、ResNet系列、SqueezeNet系列、Inception系列、DensNet系列或EfficentNet系列;
步骤S32:配置相关训练参数,所述训练参数包括随机数种子、批处理大小、最大迭代次数、验证间隔标志、模型保存路径。
4.根据权利要求3所述的一种面向深度学习的模型生成方法,其特征在于:所述步骤S4包括以下步骤;
步骤S41:拼接S1、S2、S3步骤指定的数据预处理模块、网络优化器模块、网络结构模块,并保存本次训练的配置文件;向配置文件写入数据预处理模块中所选的预处理方式的顺序组成、各个预处理方式指定的深度学习框架实现、网络优化器模块所选的优化器名称及指定的深度学习框架实现、网络结构模块所选的网络结构名称及指定的深度学习框架实现,同时写入各个模块的具体组成的参数和步骤S32中指定的整体训练参数;
步骤S42:完成模块拼接,开始模型训练流程,根据指定训练参数进行迭代训练;
步骤S43:在训练过程中监控训练流程,期间根据验证间隔标志,按预设迭代次数阈值间隔进行模型验证,并不断保存最优模型于模型保存路径下;
步骤S44:系统监控训练流程,当迭代次数达到步骤S32预设的最大迭代次数阈值时,训练流程结束,返回当前指定数据集在上述步骤自定义下的模型网络的最优准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011148399.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:阻抗自适应的等离子体手术系统
- 下一篇:一种生产铝锭用过滤板预热器





