[发明专利]训练图像分类模型的系统及方法和对图像进行分类的方法在审
| 申请号: | 202010518225.1 | 申请日: | 2020-06-09 |
| 公开(公告)号: | CN112651420A | 公开(公告)日: | 2021-04-13 |
| 发明(设计)人: | 李宝普;程治宇;包英泽 | 申请(专利权)人: | 百度(美国)有限责任公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 训练 图像 分类 模型 系统 方法 进行 | ||
1.一种用于训练图像分类模型的计算机实现的方法,所述方法包括:
形成一个或多个批次,所述一个或多个批次包括图像及与所述图像对应的标签,所述图像及与所述图像对应的标签选自一个或多个训练数据集,其中,每个图像具有对应的标签;
对于每个训练循环重复一组步骤,直到达到停止条件为止,所述一组步骤包括:
将批次输入到所述图像分类模型中,所述图像分类模型包括:
卷积模块,包括具有一组滤波器的卷积、批次归一化操作和激活操作;
第一残差模块,包括由最大池化层分开的至少两个卷积模块,其中,每个卷积模块具有其自己的滤波器组;
第二残差模块,包括由最大池化层分开的至少两个卷积模块,其中,每个卷积模块具有其自己的滤波器组;以及
全连接层,接收从所述第二残差模块的输出获得的输入;
在给出所述批次的预测输出的情况下,确定所述图像分类模型的损失;以及
利用所述损失更新所述图像分类模型的一个或多个参数。
2.如权利要求1所述的计算机实现的方法,还包括:
确定每个训练循环的学习率。
3.如权利要求2所述的计算机实现的方法,其中,确定每个训练循环学习率的步骤包括:
使用分段线性函数来确定训练循环的学习率,所述分段线性函数将训练循环数与学习率相关联。
4.如权利要求3所述的计算机实现的方法,其中,所述分段线性函数包括:
第一线性部分,其中,随着训练循环的增加,学习率从零或接近零线性增加到峰值点;以及
第二线性部分,其中,随着训练循环的增加,学习率从峰值点线性地降低到接近零,其中,所述第一线性部分的斜率大小大于所述第二线性部分的斜率大小。
5.如权利要求1所述的计算机实现的方法,其中,所述第一残差模块和所述第二残差模块中的至少一个包括增加数量的滤波器以增加所述图像分类模型的特征表示。
6.如权利要求1所述的计算机实现的方法,其中,所述第一残差模块和所述第二残差模块中的至少一个还包括位于所述最大池化层之后的两个卷积模块。
7.如权利要求1所述的计算机实现的方法,其中,用于卷积的滤波器的数量与用于训练所述图像分类模型的系统的处理器单元并行能力相匹配。
8.如权利要求1所述的计算机实现的方法,其中,为批次选择的图像的数量被确定为使得所述批次的存储要求小于用于训练所述图像分类模型的处理器单元的存储限制。
9.一种用于训练图像分类模型的系统,所述系统包括:
一个或多个处理器;以及
非暂时性计算机可读介质,包括一组或多组指令,所述一组或多组指令在由所述一个或多个处理器中的至少一个执行时使得执行以下步骤:
形成一个或多个批次,所述一个或多个批次包括图像及与所述图像对应的标签,所述图像及与所述图像对应的标签选自一个或多个训练数据集,其中,每个图像具有对应的标签;
对于每个训练循环重复一组步骤,直到达到停止条件为止,所述一组步骤包括:
将批次输入到所述图像分类模型中,所述图像分类模型包括:
卷积模块,包括具有一组滤波器的卷积、批次归一化操作和激活操作;
第一残差模块,包括由最大池化层分开的至少两个卷积模块,其中,每个卷积模块具有其自己的滤波器组;
第二残差模块,包括由最大池化层分开的至少两个卷积模块,其中,每个卷积模块具有其自己的滤波器组;以及
全连接层,接收从所述第二残差模块的输出获得的输入;
在给出所述批次的预测输出的情况下,确定所述图像分类模型的损失;以及
利用所述损失更新所述图像分类模型的一个或多个参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010518225.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





