[发明专利]一种基于图像融合和改进ResNet的图像识别方法有效
申请号: | 201910724082.7 | 申请日: | 2019-08-07 |
公开(公告)号: | CN110516687B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 李建强;李鹏智;谢海华;王延安 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/56;G06K9/62;G06T5/40;G06T7/44;G06T7/90;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 融合 改进 resnet 识别 方法 | ||
本发明涉及一种基于图像融合和改进ResNet的图像识别方法。本发明设计提取图像的多种特征,对大尺寸原图像进行主成分分析,分成从大到小的三个主成分向量,保留第一主成成分,即保留原图像的最大特征;然后对于两个较小的主成分分别用提取的两个特征进行替换,生成新的大尺寸图像。用新的大尺寸图像去训练改进的ResNet模型,从而提升模型对于尺寸比较大、光线强弱以及背景的干扰比较突出的图像识别分类的准确性和敏感度。
技术领域
本发明设计提取图像的多种特征,对大尺寸原图像进行主成分分析,分成从大到小的三个主成分向量,保留第一主成成分,即保留原图像的最大特征;然后对于两个较小的主成分分别用提取的两个特征进行替换,生成新的大尺寸图像。用新的大尺寸图像去训练改进的ResNet模型,从而提升模型对于尺寸比较大、光线强弱以及背景的干扰比较突出的图像识别分类的准确性和敏感度。
背景技术
图像识别是人工智能的一个重要领域,根据各自在图像信息中所反映的不同特征,对目标区识别分类的图像处理方法。图像识别的传统方法是特征描述及检测,但由于实际情况非常复杂,传统的分类方法不堪重负。现在比较流行的是某种CNN模型来进行图像的识别分类,如ResNet。ResNet的结构可以极快的加速深层神经网络的训练,模型的准确率也有比较大的提升。但是在用ResNet训练较大尺寸的图像时,一般都要将图像进行缩放,以此保证最后的feature maps大小尺寸合适,如512X512尺寸的图像缩放成224X224尺寸的图像,这样过大的放缩就会导致图像损失一些细节影响识别精度。其次,由于拍摄图像的背景和光线强弱的变化,准确的识别分类还是很困难的。目前,对于尺寸比较大的图像、光线强弱以及背景的干扰比较突出的图像识别分类的准确性和敏感性有待于提高优化。
发明内容
本发明设计对于原始图像数据进行白化处理和提取LBP纹理特征,然后利用PCA对原始RGB图像进行主成分分析,依次从小到大得到三个主成分向量,然后保留第一大主成分,用白化处理特征的和LBP特征分别进行直方图配准后替换较小的两个主成分形成新的图像。这样就可以保留原图像的主要信息,替换掉图像中的一些噪音信息。其次,对于ResNet模型,去掉模型自带的平均池化层和全连接层,然后依次加入Relu层、3*3卷积层、Batch Normalization层、平均池化层、全连接层,以此来改进现有模型,提高对大尺寸图像的适应能力。最后用形成的新的训练样本集合去训练改进后的ResNet模型,得到最终的识别分类结果,从而提升对于尺寸比较大、光线强弱以及背景的干扰比较突出的图像识别分类的准确性和敏感度。
本发明采用了如下的技术方案及实现步骤:
1.一种基于图像融合和改进ResNet的图像识别方法,其特征在于,
具体包括以下步骤:
(1)制作图像训练样本:
(1)-1对训练图像数据集合进行相关专家标记,形成图像训练样本集合,原图像是r*c尺寸的RGB图像;
(2)白化处理以及提取LBP特征:
(2)-1对于原图像利用现有的数字图像处理方法分别进行提取白化特征和LBP特征,
(3)主成分分析替换处理:
(3)-1读取原RGB图像获得相应的矩阵,记做mol0,即mol0的形式为r*c*3;读取白化图像矩阵为r*c,记做ban0;读取LBP矩阵为r*c,记做ban010;然后进行矩阵数据归一化预处理在0-1之间:公式(1)如下:
mol=mol0/255;ban=ban0/255;ban01=ban010/255 (1)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910724082.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:三色RGB图像的蚊虫识别方法
- 下一篇:肺结节属性特征信息的提取方法及系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序