[发明专利]一种基于图像注意力加权池化的室外地点重识别方法在审
申请号: | 202210357394.0 | 申请日: | 2022-04-06 |
公开(公告)号: | CN114743101A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 张晓峰;欧垚君;陈哲;王梅;丁红;施正阳;陶秦;魏东 | 申请(专利权)人: | 南通大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06N3/04;G06N3/08;G06V10/44;G06V10/82 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 张俊俊 |
地址: | 226019 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 注意力 加权 室外 地点 识别 方法 | ||
本发明提供了一种基于图像注意力加权池化的室外地点重识别方法,属于计算机视觉深度学习技术领域。解决了室外场景下地点重识别任务容易受到动态物体干扰的问题。其技术方案为:包括以下步骤:步骤一、从卷积神经网络提取特征图;步骤二、显著性区域的检测;步骤三、生成图像注意力;步骤四、损失函数计算损失。本发明的有益效果为:本发明检测图片最显著的部分同时抑制动态物体的干扰;在室外场景下能提取鲁棒性更强的图像全局特征,减少误匹配。
技术领域
本发明涉及计算机视觉、深度学习技术领域,尤其涉及一种基于图像注意力加权池化的室外地点重识别方法。
背景技术
视觉地点重识别是计算机视觉研究领域中十分重要的一项研究,特别是长期自主导航的移动机器人,图像定位等。视觉地点重识别可以看作是大规模图像检索任务,在数据库中检索出与查询图片最为相似的图片。但在室外场景下,由于光照变化、动态物体遮挡、视点变化和季节变化等原因使得该项任务变得十分困难。即使是相同的场景地点下的也会有完全不一样的外观。因此,如何创建鲁棒的图片特征成为了研究的难点。
为了区分任务相关的视觉线索,图像注意力机制在近些年被提出。图像注意力机制可以分为数据驱动的方法和基于规则的方法。基于规则的方法过于依赖先验知识,容易忽略人类认知以外的因素。数据驱动的方法通过大量数据训练,检测到具有区别性的显著性区域,通常以矩形方框表示。但显著性物体例如建筑、路标等有可能是任何形状,而且由于物体遮挡的因素,只用矩阵形状的方框代表显著性物体的方法仍然是不足的。
如何解决上述技术问题为本发明面临的课题。
发明内容
本发明的目的在于提供一种基于图像注意力加权池化的室外地点重识别方法,首先对CNN提取的高维特征进行处理,使用区域采样的方式获得图像的局部描述子,然后,利用本发明提出的注意力模块对先前提取到的局部描述子进行加权处理,获得鲁棒的图像特征,本发明的目的在于提供一种更为健壮的特征提取方法,对室外场景的各种干扰下能更好地提取图像全局特征。
本发明的发明思想为:本发明通过把整个流程分为两个部分,一部分是在图片进行区域采样,第二部分是生成图像注意力,生成全局特征,并通过三元组损失函数计算损失,进行网络训练;本发明提供的基于图像注意力加权池化的室外地点重识别方法,对图像区域进行采样得到局部特征,并利用网络生成的图像注意力进行加权池化得到全局特征。
本发明是通过如下措施实现的:一种基于显著性区域检测的室外地点重识别方法,包含以下步骤:
步骤一、从卷积神经网络提取特征图
方法的第一步是通过预训练的卷积神经网络模型对输入图片进行特征的提取,卷积神经网络模型通常由卷积层,激活层,池化层和最后的全连接层组成。卷积层通常嵌入丰富的空间信息,所以由卷积层输出的特征图可以被看作是卷积核在图像中提取到的特征描述子。因此,把图像输入卷积神经网络模型后,在进行全连接操作之前输出,得到维度为W×H×C的特征图,W和H分别为特征图的宽和高,C为特征图的通道数。我们把这个特征图看作是多个图像描述子的集合F。如公式所示,其中每个特征描述子的维度为C,总共有W×H个特征。其中,每个描述子代表输入图像中一个区域的感受野。
F={fi∈RC|i∈{1,...,W×H}} (1)
步骤二、显著性区域的检测
通过前一步的处理得到了图像局部描述子的集合F,卷积神经网络模型对图像的每个均匀的区域都提取了对应的描述子。然而,单个局部描述子不能代表图像中具有代表性的建筑或物体,它可能是地标的其中一部分或者是某些不具有代表性的空间信息,比如天空,地面等。因此需要从局部描述子中检测出具有代表性的显著性区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210357394.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序