[发明专利]一种基于深度Gabor网络的图像目标识别方法有效

申请号：	201811605971.3	申请日：	2018-12-26
公开（公告）号：	CN109766934B	公开（公告）日：	2020-12-11
发明（设计）人：	王田;李嘉锟;单光存;文博;文社欣	申请（专利权）人：	北京航空航天大学;博恒科技（杭州）有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46;G06N3/04;G06N3/08
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	安丽
地址：	100191***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度 gabor 网络图像目标识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度Gabor网络的图像目标识别方法，其特征在于：实现步骤如下：

步骤1：读取需要进行目标识别的图像或视频数据，如果数据为视频数据，则视频数据分解成单帧图像序列；将图像数据，或者视频分解出的单帧图像序列，分为训练数据和测试数据，分别构成训练数据集与测试数据集；

步骤2：在目标识别的算法中包含训练和测试两个过程，在训练过程中，将对于步骤1得到的训练数据进行标记，根据图像中目标种类对图像进行标记，将图像数据打上类别标签，得到标记后的训练数据；

步骤3：针对步骤2得到的标记后的训练数据进行数据增广，将增广后的数据加到原始数据中，得到的数据增广后的训练数据；

步骤4：将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入，利用监督学习方法，通过最小化损失函数，训练深度Gabor网络，得到深度Gabor网络；利用Gabor网络对训练数据进行分类，对比数据标签，得到分类正确的训练数据与分类错误的训练数据，分类错误的训练数据被认为是困难数据；

步骤5：对于步骤4得到的深度Gabor网络，针对分类错误的训练数据进行困难数据挖掘，采用生成对抗网络成类似的困难数据，将困难数据通过深度Gabor网络进行训练，提升深度Gabor网络的性能，至此完成训练阶段；

步骤6：在测试阶段中，利用训练好的深度Gabor网络作为测试过程的网络，对于输入的图像利用Gabor网络提取图像的特征，输出对所述图像的识别结果，从而对图像目标识别；

所述步骤4中，利用监督学习方法，通过最小化损失函数，训练深度Gabor网络的过程：

步骤i) 训练过程为有监督学习过程，图像目标识别的数据为多类别的数据，深度Gabor网络采用交叉熵作为损失函数；

步骤ii) 对于图像目标识别的深度Gabor网络的组成均为Gabor滤波器；

步骤iii) 设计深度Gabor网络的4个Gabor层，Gabor层的Gabor滤波器数量依次为32、64、128和128个，每个Gabor层由多个不同参数的Gabor滤波器组成；

步骤iv) 在步骤iii)的基础上，对每个Gabor层后分别添加激活层、批标准化层和池化层，对于网络中的Gabor的角度参数进行参数优化；

步骤v)根据步骤i设定的损失函数，取学习率为0.001对网络进行训练，参数优化方法采用梯度下降法，得到训练好的深度Gabor网络；

所述步骤5中，对于步骤4得到的深度Gabor网络采用困难样本挖掘为：

步骤i) 在目标分类深度Gabor神经网络训练过程中，需要对分类错误的训练数据进行困难样本挖掘，提高神经网络分类的准确率，利用生成对抗网络对分类错误的训练数据的生成；

步骤ii) 设定训练步数X，若达到训练要求，则停止针对分类错误的训练数据的对抗生成网络的训练，利用生成的数据作为训练数据集的补充样本；

步骤iii) 将容易分错的样本与生成对抗网络生成的样本融合，作为扩充的训练样本数据集，提高图像目标分类的精度，修正深度Gabor网络，至此完成训练阶段，得到训练好的深度Gabor网络。

2.根据权利要求1所述的一种基于深度Gabor网络的图像目标识别方法，其特征在于：所述步骤3中，进行数据增广的过程如下：

步骤i) 针对步骤2得到的标记后的训练数据，利用图像旋转、局部裁剪、上下对称翻转、左右对称翻转、颜色抖动方式进行图像数据增广；

步骤ii) 对数据增广后得到的更多的数据，加到原始数据中，增大训练数据集的规模，提高深度Gabor网络的训练的有效性。

3.根据权利要求1所述的一种基于深度Gabor网络的图像目标识别方法，其特征在于：所述步骤6中，在测试阶段中：

步骤i) 将输入的图像数据进行预处理，如果输入数据为视频数据，则频分解成单个帧，而后输入训练好的深度Gabor网络单帧图像进行测试；如果输入数据为图像，则将单帧图像输入训练好的深度Gabor网络单帧图像进行测试；

步骤ii) 利用步骤5中训练好的深度Gabor网络作为测试过程的网络，将输入的图像利用Gabor滤波器提取图像的纹理特征，利用池化进行空间输入融合，得到深度Gabor网络针对图像的特征描述；

步骤iii) 利用深度Gabor网络后端的全连接网络，对深度Gabor网络得到图像特征进行分类，输出对图像数据的识别结果，从而完成对测试图像的目标识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;博恒科技（杭州）有限公司，未经北京航空航天大学;博恒科技（杭州）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811605971.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载