[发明专利]一种基于深度Gabor网络的图像目标识别方法有效

专利信息
申请号: 201811605971.3 申请日: 2018-12-26
公开(公告)号: CN109766934B 公开(公告)日: 2020-12-11
发明(设计)人: 王田;李嘉锟;单光存;文博;文社欣 申请(专利权)人: 北京航空航天大学;博恒科技(杭州)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06K9/46;G06N3/04;G06N3/08
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 安丽
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 gabor 网络 图像 目标 识别 方法
【说明书】:

发明涉及一种基于深度Gabor网络的图像目标识别方法,包括:对图像或者视频进行单帧分解得到单帧图像,利用深度Gabor网络进行特征提取与融合,而后利用全连接网络达到目标识别的目的。目标识别过程分为训练和测试两个过程。在训练中,以训练样本的图像作为深度Gabor网络的输入,通过最小化损失函数来训练整个深度Gabor网络,得到深度Gabor网络的权重值。同时对易错的训练样本进行困难样本挖掘,以提高深度Gabor网络的性能。在测试阶段,以测试样本的图像作为输入,利用训练好的深度Gabor网络提取测试样本的图像特征,然后利用训练好的全连接网络进行测试样本的分类,由此实现目标的识别。

技术领域

本发明涉及图像处理技术,特别是涉及一种基于深度Gabor网络的图像目标识别方法。

背景技术

针对图像的目标识别可以用于各方面,包括网络上图像目标的理解、智慧城市、监控场景中的目标的发掘、人机交互中的场景理解等。深度学习技术给图像目标的识别提供了强有力的手段,并在多个社会领域上取得了成功。包括基于图像内容的搜索、以图搜图、监控中的人物再识别等。目前面向图像目标识别的深度学习主要采用基于卷积神经网络的结构,并在结构、网络的层数、网络的参数量上逐渐提高,对系统提高了要求。为了将网络的参数量降低,研究一种小参数量的网络具有重要意义。

现有图像目标识别的网络采用卷积核作为基本的结构,由于该结构靠大量的参数的学习来拟合训练数据,其确实理论的解释也是被大家诟病的地方。本发明创新性的提出采用Gabor滤波器来提取图像的特征,由于Gabor滤波器模拟人脑对于纹理的响应,有理论分析与支撑。并提出紧接Gabor层的激活层、批标准化层和池化层,完成参数的学习和训练。

发明内容

有鉴于此,本发明的主要目的在于提供一种基于Gabor算子的目标识别方法,并且能相比现有方法具有更小的参数量与适应范围。

为了达到上述目的,本发明提出的技术方案为:一种基于深度Gabor网络的图像目标识别方法,包括如下步骤:

步骤1、读取需要进行目标识别的图像或视频数据,如果数据为视频数据,则视频数据分解成单帧图像序列;将图像数据,或者视频分解出的单帧图像序列,分为训练数据和测试数据,分别构成训练数据集与测试数据集。

步骤2、在目标识别的算法中包含训练和测试两个过程,在训练过程中,将对于步骤1得到的训练数据进行标记,根据图像中目标种类对图像进行标记,将图像数据打上类别标签,得到标记后的训练数据。

步骤3、针对步骤2得到的标记后的训练数据进行数据增广,将增广后的数据加到原始数据中,得到的数据增广后的训练数据。

步骤4、将步骤3得到的数据增广后的训练数据作为深度Gabor网络的输入,利用监督学习方法,通过最小化损失函数,训练深度Gabor网络,得到深度Gabor网络。利用Gabor网络对训练数据进行分类,对比数据标签,得到分类正确的训练数据与分类错误的训练数据,分类错误的训练数据被认为是困难数据。

步骤5、对于步骤4得到的深度Gabor网络,针对分类错误的训练数据进行困难数据挖掘,采用生成对抗网络生成类似的困难数据,将困难数据通过深度Gabor网络进行训练,提升深度Gabor网络的性能,至此完成训练阶段。

步骤6、在测试阶段中,利用训练好的深度Gabor网络作为测试过程的网络,对于输入的图像利用Gabor网络提取图像的特征,输出对该图像数据的识别结果,从而对图像目标识别。

本发明与现有技术相比的优点在于:

(1)本发明具有模型可解释的特点。由于传统的深度学习都是采用卷积核来对图像进行处理,并没有很强的理论的解释性。本发明由于采用Gabor滤波器作为基础来构建神经网络,利用Gabor模拟人的视觉感知中对于纹理与边界敏感的特点,具有可解释的理论基础。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;博恒科技(杭州)有限公司,未经北京航空航天大学;博恒科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811605971.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top