[发明专利]一种基于稠密PCANet的鲁棒图像识别方法有效
申请号: | 202010147376.0 | 申请日: | 2020-03-05 |
公开(公告)号: | CN111488907B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 李小薪;徐晨雅;胡海根;周乾伟;郝鹏翼 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稠密 pcanet 图像 识别 方法 | ||
一种基于稠密PCANet的鲁棒图像识别方法,包括鲁棒特征提取和基于卡方距离的最近邻分类两个步骤。鲁棒特征提取过程使用了特征图的稠密连接和模式图的稠密编码,稠密连接即将所有卷积层输出的特征都合并起来,形成更宽的卷积层特征;稠密编码即在利用卷积层进行模式图编码时,采用较小的跳跃幅度,使得模式图尽可能地反应特征图之间的相关性。分类过程包括:步骤1,在高维柱状图特征空间中,基于卡方距离获取待识别图像到各训练图像的距离度量;步骤2,获取具有最小距离度量的训练样本所对应的类标,作为待识别图像的类标。本发明能够有效的处理待识别图像中的遮挡、光照变化、分辨率差异等变化,从而有效地提升了有偏移图像的识别率。
技术领域
本发明涉及图像处理和模式识别领域,尤其是待识别图像与训练图像有较大差异的鲁棒图像识别,主要用于处理和识别现实中的图像。
背景技术
近来,在计算机视觉和图像识别领域中,以卷积神经网络(Convolutional NeuralNetworks,CNN)为代表的深度神经网络(Deep Neural Network,DNN)取得了极大的成功,在一些公开的数据集上,前沿的深度学习方法的分类能力甚至超过了人类,例如:在LFW人脸数据库上的认证准确率,在ImageNet上的图像分类准确率,以及在MNIST上的手写数字识别准确率等。然而,在实际中,待识别图像在“分布”或“结构”上往往与训练图像有较大的差异,这种差异会导致DNN出现较大规模的识别错误,在深度学习领域中,这一现象被称为“协变量偏移(Covariate Shift)”。
发明内容
为了克服现有图像识别方法的协变量偏移所引发的图像识别率较低的不足,本发明提出了一种基于稠密PCANet(Dense PCANet,DPCANet)的鲁棒图像识别方法。DPCANet能够有效克服由于协变量偏移所引发的识别问题,尤其是当待识别图像存在遮挡、光照变化、分辨率差异等幅度较大的偏移时,能够大幅度提升图像识别性能。
本发明解决其技术问题所采用的技术方案是:
一种基于稠密PCANet的鲁棒图像识别方法,包括以下步骤:
步骤1选取J张图像A={A1,…,AJ}作为训练集,对应的类别标签为Y={Y1,…,YK}为待识别图像的集合,即测试集,这里,分别表示实数域上的具有C0∈{1,3}个通道的长宽为m×n的图像;
步骤2初始化参数和输入数据:令这里,用于指示网络所处的阶段,表示网络处于训练阶段,表示网络处于测试阶段;令l=0,这里,l用于指示输入图像或特征图在网络中的层数,其中,N=J,令F={F1,…,FN}表示由各卷积层所生成的特征图的集合,这里,表示空集;
步骤3由构建矩阵
其中,为的均值,表示从的第c个通道中抽取的第b∈{1,2,…,mn}个大小为k×k的特征块,Vec(·)表示将矩阵拉伸为列向量的运算;
步骤4如果表示网络处于测试阶段,跳至步骤7,否则,执行下一步;
步骤5计算的主方向其中,为协方差矩阵的第i′个特征向量,对应的特征值为λi′,且
步骤6由V(l)获取Cl+1个通道相关式滤波器组
步骤7按照如下步骤计算第l+1个卷积层的特征图集X(l+1):7.1)将投影到7.2)将中的元素重新组织为特征图集其中,且这里,表示的第c列的从第a到b行的列向量,a%b表示a对b取余,表示对实数a下取整,matm×n(ν)表示将任意列向量重新排列为m×n的矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010147376.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序