[发明专利]基于卷积神经网络的图像分类方法、装置及卷积神经网络在审
| 申请号: | 202010746150.2 | 申请日: | 2020-07-29 |
| 公开(公告)号: | CN114091648A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 吴进 | 申请(专利权)人: | 中移(苏州)软件技术有限公司;中国移动通信集团有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘鹤;张颖玲 |
| 地址: | 215163 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 卷积 神经网络 图像 分类 方法 装置 | ||
本申请实施例公开了一种基于卷积神经网络的图像分类方法、装置、卷积神经网络、电子设备及计算机可读存储介质,所述方法包括:获取第一数据,所述第一数据表征为多个图像和与每个图像对应的类别信息;基于所述第一数据对所述卷积神经网络进行训练;利用基于所述第一数据训练得到的所述卷积神经网络,对待识别图像进行识别,得到与所述待识别图像对应的类别信息;卷积神经网络包括依次连接的第一处理层、两个以上并行的子卷积神经网络层及第二处理层;本申请提出了全新的卷积神经网络,通过两个以上并行的子卷积神经网络层能够提高特征值的提取数量,并降低数据处理过程中的运算量,提高数据处理的效率。
技术领域
本申请涉及图像分类技术,尤其涉及一种基于卷积神经网络的图像分类方法、装置、卷积神经网络、电子设备及计算机存储介质。
背景技术
当前卷积神经网络的结构主要朝两个方向变化,一种是网络的深度越来越深。经典的卷积神经网络LeNet5只有2个卷积层和2个将采样层提取特征,再连接全连接层实现图像分类,虽然取得了很高的识别率,但是仍然存在很多问题。首先它的成功是基于小型的数据集,图像的尺寸很小,以同样的训练模型不能应用在其他较大型的数据集和其他更加复杂的识别任务上。当时的计算机计算性能落后,不能满足大型计算需求,之后很长一段时间卷积神经网络没有取得很大的成功。针对这个问题,Krizhevsky等人提出了新的卷积神经网络结构AlexNet,整个网络的结构更宽更深,成功的运用了激活函数、正则化和数据增强等方法,将卷积神经网络应用到包括一百二十万张图片的大型数据集ImageNet上,利用强大的GPU并行计算并达到了较其他算法最高的识别率。序贯结构模型VGGNet将卷积神经网络的深度扩展,使用较小的卷积核将卷积层叠加,将ImageNet的识别率达到了更好的水平。
另一种是结构的变化。一味地增加卷积神经网络的深度会增加参数和计算量,模型难以优化,AlexNet的参数量达到了60M,增加深度对计算机的计算性能要求更高。2013年提出了NIN结构,通过1x1的小型卷积核减少了卷积层的参数,并且针对卷积神经网络的参数集中在全连接层的问题提出了全局平均池化Global average pooling,大大地减少了网络的参数。Inception模块,不同的卷积层作用在同一特征图上,提取的特征多样,泛化能力较强。卷积层深度的增加会导致准确率上升,但是持续增加会导致准确率不变甚至下降,针对这个问题,残差网络ResNet使用了和VGGNet相同的小型卷积层连续堆叠增加卷积神经网络深度的策略,但是使用了残差模块,虽然网络的深度达到了152层,但是参数数量却比VGGNet更少,准确率更高。
随着识别任务的要求越来越高,浅层卷积神经网络已经不能满足需求。同时越来越多的研究者优化卷积神经网络,但是仍存在如下不足:
深度卷积神经网络的复杂度和运算量较大;
卷积神经网络的深度的逐渐加深,虽然达到的精度也越来越高,伴随而来的是网络的参数越来越庞大,会出现识别精度先随着网络的深度增加而逐渐增加,然后逐渐达到饱和,之后再继续增加网络深度会导致精度不变,甚至下降;
卷积神经网络结构的结构类型单一,提取的特征较少。随着人工智能应用范围的不断提升,人机交互的手段也在不断地复杂化。
发明内容
本申请提供了一种基于卷积神经网络的图像分类方法、装置、卷积神经网络、电子设备及计算机存储介质。
本申请实施例提供一种基于卷积神经网络的图像分类方法,所述卷积神经网络包括:第一处理层、两个以上并行的子卷积神经网络层及第二处理层;所述第一处理层的输出端分别与所述两个以上并行的子卷积神经网络层的输入端连接,所述两个以上并行的子卷积神经网络层的输出端分别与所述第二处理层的输入端连接;输入所述第一处理层的数据经所述第一处理层处理后,能够分别通过所述两个以上并行的子卷积神经网络层进行处理,处理得到的两个以上的子处理结果能够在所述第二处理层叠加得到处理结果;所述方法包括:
获取第一数据,所述第一数据表征为多个图像和与每个图像对应的类别信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(苏州)软件技术有限公司;中国移动通信集团有限公司,未经中移(苏州)软件技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010746150.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:亮度参数校正方法、装置、设备及亮度补偿系统
- 下一篇:洗涤剂盒和衣物处理设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





