[发明专利]一种基于深度学习的图像分类方法有效
申请号: | 201810524263.0 | 申请日: | 2018-05-28 |
公开(公告)号: | CN108846421B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 李建军;薛鑫营;郭辉;虞杰;郑秋华;王智慧;李豪杰 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 分类 方法 | ||
本发明公开了一种基于深度学习的图像分类方法。本发明具体包括如下步骤:S1、将图片分为n组,将n组图片集分别作为样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅰ;S2、将待测图像样本输入到已经完成训练的图像分类模型Ⅰ中进行图像分类;S3、将不同待测图像对应的结果集归入不同的文档中,将精度较高的图像结果集重新组成图像样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅱ;S4、将所对应的待测图像样本输入到其对应的图像分类模型Ⅱ中进行图像分类。本发明能够进一步提高图像分类的准确率,为图像分类工作提供了新的解决方案。
技术领域
本发明属于计算机视觉领域,涉及一种基于深度学习的图像分类方法。
背景技术
从1965年开始,人们开始研究图像处理和识别。随着科技进步,深度学习成为了图像分类的主流方法。AlexNet模型就是一种基于深度学习的图像分类模型。
AlexNet是2012年ImageNet竞赛冠军获得者Alex Krizhevsky设计的,它主要包括5个卷积层,3个全连接层。
AlexNet在输入时对224*224*3的图像进行预处理,将其处理为227*227*3的图像。
第一个卷积层中,AlexNet采用96个11*11*3的卷积核,在步长为4的前提下对227*227*3的图像进行了滤波。最初的输入神经元个数为224*224*3=150528个,由于其步长为4,卷积核大小为11*11*3,故而本层的特征图的大小为:
(227-11)/4+1=55
也就是96个55*55大小的特征图,其神经元个数为55*55*96=290400。得到卷积数据后,对其进行一次Relu,并对其进行池化(map大小减半),之后将其作为第二层的输入。
第二个卷积层中,AlexNet采用256个5*5的过滤器对96*27*27个特征图进行进一步特征提取,但是此时过滤器是对96个特征图中的某几个特征图中相应的区域乘以相应的权重,之后再加上偏置之后所得到的区域进行卷积,经过这样的处理,会得到256个新的特征图,特征图的大小为:
(27+2*2-5)/1+1=27
也就是256个27*27大小的特征图,其神经元个数为
256*27*27=186624。之后对其进行Relu操作,在对其进行降采样处理(特征图的大小减半),得到256个13*13大小的特征图。
第三个卷积层中,AlexNet采用384个3*3大小的过滤器对256*13*13个特征图进一步提取特征,经过处理,会得到384个新的特征图,特征图的大小为:
(13+2*1-3)/1+1=13
即384个13*13的新特征图,其神经元个数为384*13*13=64896。之后对其进行Relu操作,在第三个卷积层中,不对其使用降采样处理。
第四个卷积层中,AlexNet采用384个3*3大小的过滤器对384*13*13个特征图进一步提取特征,经过处理,会得到384个新的特征图,特征图的大小为:
(13+2*1-3)/1+1=13
即384个13*13的新特征图,其神经元个数为384*13*13=64896。之后对其进行Relu操作,在第四个卷积层中,同样不对其进行降采样处理。
第五个卷积层中,AlexNet采用256个3*3大小的过滤器对384*13*13个特征图进一步提取特征,经过处理,会得到256个新的特征图,特征图的大小为:
(13+2*1-3)/1+1=13
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810524263.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络结构以及客户端
- 下一篇:跨社交网络的账号关联方法及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序