[发明专利]基于稀疏注意力网络的行人再辨识方法有效
| 申请号: | 201910543465.4 | 申请日: | 2019-06-21 |
| 公开(公告)号: | CN110414338B | 公开(公告)日: | 2022-03-15 |
| 发明(设计)人: | 张灿龙;解盛;李志欣 | 申请(专利权)人: | 广西师范大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/77;G06V10/774;G06V10/764;G06K9/62;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
| 地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 稀疏 注意力 网络 行人 辨识 方法 | ||
本发明公开一种基于稀疏注意力网络的行人再辨识方法,首先通过短连接将浅层特征无损传输到深层特征;然后通过不断叠加的残差模块组成的主干残差网络来提取到图像主要卷及特征;接着通过主干残差网络中嵌入的归一化的压缩‑激励模块提取图像易被损失的细节特征;最后将上述得到的特征相乘,最后再加上第一部分所得的特征,输送进全连接层和分类回归层从而得到分类和回归结果。本发明的稀疏注意力网络可有效提取到数个行人再辨识数据集的行人照片细节特征。
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种基于稀疏注意力网络的行人再辨识方法。
背景技术
行人再辨识是指对不同监控场景中的同一行人进行身份再确认,以弥补单个摄像头的视觉局限。行人再辨识可广泛应用于智能图像理解、智能视频分析、智能视频侦查等领域。目前,应用于行人再辨识的方法主要分为:基于人工设计特征的行人再辨识和基于深度卷积神经网络的行人再辨识。基于人工设计特征的行人再辨识主要包含人工设计特征提取和特征的相似性度量两部分;基于深度卷积神经网络的行人再辨识模型可以将特征表达和相似性度量两个环节整合在一起,通过二者的联合优化获取远超传统方法的性能。随着深度学习技术飞速发展和近期大型行人再辨识数据集的出现,深度行人再辨识技术得到了快速发展,已成为目前行人再辨识领域主流的方法。
论文“Deep Residual Learning for Image Recognition(用于图像识别的深度残差学习)”(发表于《Conference on Computer Vision and Pattern Recognition(计算机视觉和模式识别会议)》)在经典卷积神经网络的基础上提出了残差学习,使得卷积神经网络在变得更深的同时识别效果也更好,开启了各领域广泛使用深度学习的新纪元。论文“Show,Attend and Tell:Neural Image Caption Generation with Visual Attention(观看,专注和描述:通过视觉注意力机制生成神经图像描述)”(发表于《InternationalConference on Machine Learning(国际机器学习大会)》)将自然语言处理领域的注意力机制应用于智能图像处理,并在图像描述等方向取得了跨越性的提高,开启了注意力机制应用于智能图像处理的新纪元。论文“Squeeze-and-Excitation Networks(压缩-激励卷积神经网络)”(发表于《Conference on Computer Vision and Pattern Recognition(计算机视觉和模式识别会议)》)在上述残差网络的基础上,加入注意力模块(压缩-激励模块),使得模型可以提取到图片更多的细节特征并提高准确率。论文“Beyond Part Models:Person Retrieval with Refined Part Pooling(专注区域的模型:使用精化的区域池化进行行人搜索)”(发表于《European Conference on Computer Vision(计算机视觉欧洲会议)》)在残差网络的基础上提出了将行人图片水平均匀分割为六部分,这样可以使得模型更专注于细节,从而提高分类准确率。
不难看出,目前大部分行人再辨识方法都以残差网络为基础架构,通过改进残差网络的结构来提高行人分类准确率,但是这些改进方法没有利用注意力机制善于专注细节的优点去改进模型,使得模型在提取图像特征时容易损失大量有效特征。因此,有必要发明一种能够使得模型在深度学习时可以提取到图像更多细节特征的方法。
发明内容
本发明所要解决的是现有的行人再辨识方法在进行深度学习时损失大量有效特征的问题,提供一种基于稀疏注意力网络的行人再辨识方法,其在模型复杂度不变的情况下,能显著提升对行人图像细节特征的提取性能以及缓解有效特征损失,并提高行人分类准确率。
为解决上述问题,本发明是通过以下技术方案实现的:
基于稀疏注意力网络的行人再辨识方法,包括如下步骤:
步骤1、将已知的行人再辨识数据集中的图像分为训练集和测试集,并分别对训练集和测试集中的图像进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910543465.4/2.html,转载请声明来源钻瓜专利网。





