[发明专利]一种基于改进残差网络的图像分类方法在审
申请号: | 202011231956.4 | 申请日: | 2020-11-06 |
公开(公告)号: | CN112329857A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 潘晓光;张海轩;焦璐璐;张雅娜;宋晓晨 | 申请(专利权)人: | 山西三友和智慧信息技术股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 太原荣信德知识产权代理事务所(特殊普通合伙) 14119 | 代理人: | 杨凯;连慧敏 |
地址: | 030000 山西省*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 网络 图像 分类 方法 | ||
本发明属于图像分类技术领域,具体涉及一种基于改进残差网络的图像分类方法,包括以下步骤:S1、获取公共数据集,完成模型训练所需数据集的构建;S2、对数据集统一尺度大小,同时进行归一化,数据划分,去噪等图像增强方法,并进行随机裁剪、随机擦除用于数据扩充,提高模型识别准确率;S3、使用层次分割模块和注意力机制用于改进残差网络模型用于提高模型识别性能,加快运行时间;S4、当模型的损失函数不再下降,评价指标达到最优且趋于稳定之后,保存模型。该方法解决了现有的网络模型对图像识别效果不佳,运行时间长的问题,通过使用层次分割模块和注意力机制改进ResNet50模型用于图像识别促进网络学习更强的特征,提高模型识别准确率和资源利用率。
技术领域
本发明属于图像分类技术领域,具体涉及一种基于改进残差网络的图像分类方法。
背景技术
图像分类,顾名思义,就是为输入图像打上固定类别的标签。这是计算机视觉领域的核心问题之一,尽管听起来很简单,但图像分类有大量不同的实际应用。图像分类是人工智能领域的基本研究主题之一。
在图像识别中,模型的运算速度和计算机资源消耗越来越受到关注,但由于目前大多数卷积神经网络通过设计更深和更宽的网络模型来提高识别准确率,导致超参数增加,体系结构越来越复杂,使得模型运行所需时间极长且识别效果不佳。
目前,现有技术基于深度学习的大多数网络模型对图像识别效果不佳,而识别准确率较高的模型需更多的计算机资源,且运行时间更长。现有的ResNet50深度学习模型通过使用残差网络增加网络层数,导致计算复杂度提高,训练周期增长。
因此,有必要对上述问题做出改进。
发明内容
为了克服现有技术中存在的不足,本发明提供一种基于改进残差网络的图像分类方法,该方法可以解决现有的网络模型对图像识别效果不佳,运行时间更长,且现有的ResNet50深度学习模型计算复杂度高,训练周期长的问题。
本发明采用的技术方案为:
一种基于改进残差网络的图像分类方法,包括以下步骤:
S1、数据下载:获取公共数据集,完成模型训练所需数据集的构建;
S2、数据预处理:对获取到的数据集统一尺度大小,同时进行图像增强、数据扩充,提高模型识别准确率;
S3、识别模型:使用层次分割模块和注意力机制用于改进残差网络模型,进行模型识别性能的提高,加快运行时间;
S4、模型保存:当模型的损失函数不再下降、评价指标达到最优且趋于稳定之后,保存模型。
所述步骤S2中,所述图像增强的具体方法有归一化、数据划分和图像去噪,所述数据扩充的方法有随机裁剪、随机擦除。
所述归一化的具体方法为:对数据进行0均值归一化μ为原始数据的均值,σ为原始数据的标准差;所述数据划分的具体步骤为:使用5折交叉验证,将数据集随机划分为5组,同时随机选取其中1组作为测试集,剩余的4组作为训练集,重复进行5次,将 5次实验结果获得的评价指标取平均值作为模型识别性能指标;所述图像去噪的具体方法为:使用高斯低通滤波对图像进行去噪处理。
所述数据扩充的具体步骤为:将获取的图像数据集裁剪为不同尺度大小的图片或者在原图中随机选择一个矩形区域,将该区域的像素替换为随机值,获得不同程度遮挡的图片,实现数据集的扩充。
所述步骤S3中包括模型构建,具体步骤为:融合层次分割模块和注意力机制模块的 ResNet50模型,其中ResNet50模型使用残差连接实现网络深度的增加,同时解决梯度消失的问题,其具体公式为F(x)=H(x)-x,其中H(x)为残差网络的输出,F(x)为经过卷积操作的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西三友和智慧信息技术股份有限公司,未经山西三友和智慧信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011231956.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于混凝土的耐高温添加剂的制备方法
- 下一篇:一种农田田埂建设机械
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序