[发明专利]一种基于深度Gabor网络的图像目标识别方法有效
| 申请号: | 201811605971.3 | 申请日: | 2018-12-26 |
| 公开(公告)号: | CN109766934B | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 王田;李嘉锟;单光存;文博;文社欣 | 申请(专利权)人: | 北京航空航天大学;博恒科技(杭州)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 gabor 网络 图像 目标 识别 方法 | ||
1.一种基于深度Gabor网络的图像目标识别方法,其特征在于:实现步骤如下:
步骤1:读取需要进行目标识别的图像或视频数据,如果数据为视频数据,则视频数据分解成单帧图像序列;将图像数据,或者视频分解出的单帧图像序列,分为训练数据和测试数据,分别构成训练数据集与测试数据集;
步骤2:在目标识别的算法中包含训练和测试两个过程,在训练过程中,将对于步骤1得到的训练数据进行标记,根据图像中目标种类对图像进行标记,将图像数据打上类别标签,得到标记后的训练数据;
步骤3:针对步骤2得到的标记后的训练数据进行数据增广,将增广后的数据加到原始数据中,得到的数据增广后的训练数据;
步骤4:将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络,得到深度Gabor网络;利用Gabor网络对训练数据进行分类,对比数据标签,得到分类正确的训练数据与分类错误的训练数据,分类错误的训练数据被认为是困难数据;
步骤5:对于步骤4得到的深度Gabor网络,针对分类错误的训练数据进行困难数据挖掘,采用生成对抗网络成类似的困难数据,将困难数据通过深度Gabor网络进行训练,提升深度Gabor网络的性能,至此完成训练阶段;
步骤6:在测试阶段中,利用训练好的深度Gabor网络作为测试过程的网络,对于输入的图像利用Gabor网络提取图像的特征,输出对所述图像的识别结果,从而对图像目标识别;
所述步骤4中,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络的过程:
步骤i) 训练过程为有监督学习过程,图像目标识别的数据为多类别的数据,深度Gabor网络采用交叉熵作为损失函数;
步骤ii) 对于图像目标识别的深度Gabor网络的组成均为Gabor滤波器;
步骤iii) 设计深度Gabor网络的4个Gabor层,Gabor层的Gabor滤波器数量依次为32、64、128和128个,每个Gabor层由多个不同参数的Gabor滤波器组成;
步骤iv) 在步骤iii)的基础上,对每个Gabor层后分别添加激活层、批标准化层和池化层,对于网络中的Gabor的角度参数进行参数优化;
步骤v)根据步骤i设定的损失函数,取学习率为0.001对网络进行训练,参数优化方法采用梯度下降法,得到训练好的深度Gabor网络;
所述步骤5中,对于步骤4得到的深度Gabor网络采用困难样本挖掘为:
步骤i) 在目标分类深度Gabor神经网络训练过程中,需要对分类错误的训练数据进行困难样本挖掘,提高神经网络分类的准确率,利用生成对抗网络对分类错误的训练数据的生成;
步骤ii) 设定训练步数X,若达到训练要求,则停止针对分类错误的训练数据的对抗生成网络的训练,利用生成的数据作为训练数据集的补充样本;
步骤iii) 将容易分错的样本与生成对抗网络生成的样本融合,作为扩充的训练样本数据集,提高图像目标分类的精度,修正深度Gabor网络,至此完成训练阶段,得到训练好的深度Gabor网络。
2.根据权利要求1所述的一种基于深度Gabor网络的图像目标识别方法,其特征在于:所述步骤3中,进行数据增广的过程如下:
步骤i) 针对步骤2得到的标记后的训练数据,利用图像旋转、局部裁剪、上下对称翻转、左右对称翻转、颜色抖动方式进行图像数据增广;
步骤ii) 对数据增广后得到的更多的数据,加到原始数据中,增大训练数据集的规模,提高深度Gabor网络的训练的有效性。
3.根据权利要求1所述的一种基于深度Gabor网络的图像目标识别方法,其特征在于:所述步骤6中,在测试阶段中:
步骤i) 将输入的图像数据进行预处理,如果输入数据为视频数据,则频分解成单个帧,而后输入训练好的深度Gabor网络单帧图像进行测试;如果输入数据为图像,则将单帧图像输入训练好的深度Gabor网络单帧图像进行测试;
步骤ii) 利用步骤5中训练好的深度Gabor网络作为测试过程的网络,将输入的图像利用Gabor滤波器提取图像的纹理特征,利用池化进行空间输入融合,得到深度Gabor网络针对图像的特征描述;
步骤iii) 利用深度Gabor网络后端的全连接网络,对深度Gabor网络得到图像特征进行分类,输出对图像数据的识别结果,从而完成对测试图像的目标识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;博恒科技(杭州)有限公司,未经北京航空航天大学;博恒科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811605971.3/1.html,转载请声明来源钻瓜专利网。





