[发明专利]一种基于多注意力联合多级特征的行人再识别方法在审
| 申请号: | 202011160779.5 | 申请日: | 2020-10-27 |
| 公开(公告)号: | CN112183468A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 张国庆;戴阳;杨俊川 | 申请(专利权)人: | 南京信息工程大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 曹坤 |
| 地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 联合 多级 特征 行人 识别 方法 | ||
1.一种基于多注意力联合多级特征的行人再识别方法,其特征在于,具体步骤包括如下:
步骤(1.1)、图片预处理和设定训练次数:将行人重识别数据集划分为训练集和测试集,首先将训练集及测试集中的原始图片缩放到固定尺寸,再对缩放后的训练集中的图片进行数据增强操作,然后将经过数据增强后的训练集中的图片与经过缩放后的测试集中的图片转换为张量,从而完成图片预处理;同时设定网络训练次数用于控制网络训练的止停;
其中,所述图片预处理包括随机擦除、颜色抖动及各种仿射变换;
步骤(1.2)、判断是否达到最大训练次数,如是,则停止训练,找出所记录的最高准确度及对应的模型参数作为卷积神经网络模型的最终参数,然后对测试集进行测试,得到测试结果,即得到最佳的卷积神经网络模型;如否,则执行步骤(1.3)、(1.4)及(1.5);
步骤(1.3)、通过训练卷积神经网络模型得到特征与预测标签:将经过预处理后训练集的张量输入至卷积神经网络模型中,经过卷积池化操作后,输出张量最终的特征,并计算张量属于各个类别的概率,将其记为预测标签;
步骤(1.4)、根据损失函数对网络参数进行更新:计算预测标签与真实标签的交叉熵损失,并根据网络输出的张量特征计算三元组损失,最后根据这两个损失函数计算卷积神经网络参数的梯度,再运用随机梯度下降法更新网络参数;
步骤(1.5)、每训练10次输出一次当前卷积神经网络模型的准确度并保存当前模型参数,将其用于训练完成后的测试,进入步骤(1.2),再次判断是否达到最大训练次数。
2.根据权利要求1所述的一种基于多注意力联合多级特征的行人再识别方法,其特征在于,在步骤(1.1)中,所述图片预处理的具体方法是:
首先将训练集和测试集中原始图片缩放到固定尺寸384*128,再对缩放后的训练集中的图片执行下述数据增强操作:
(1.1.1)、水平随机翻转以扩大数据集;
(1.1.2)、随机擦除增强网络的鲁棒性;然后将经过数据增强后的训练集中的图片和经过缩放后的测试集的图片转化为张量,最后使用通道均值和标准差对张量进行标准化,再将张量归一化到0到1之间,其操作过程如下式所述:
式中,μ表示图片的均值,X表示图片张量,σ表示标准方差,max表示图片张量的最大值,min表示图片张量的最小值,X1表示标准化后的图片张量,x0表示归一化后的图片张量。
3.根据权利要求1所述的一种基于多注意力联合多级特征的行人再识别方法,其特征在于,在所述步骤(1.2)中,所述用于测试卷积神经网络模型的具体步骤是:将测试集的张量输入更新过的卷积神经网络模型中,得到测试图片的预测标签,并和真实的图片标签进行对比,计算并且记录卷积神经网络模型的预测准确度,保存卷积神经网络模型参数。
4.根据权利要求1所述的一种基于多注意力联合多级特征的行人再识别方法,其特征在于,在所述步骤(1.3)中,将经过预处理后训练集的张量输入至卷积神经网络模型中,经过卷积池化操作后,输出张量最终的特征的具体操作步骤如下:
(1.2.1)、通过重组的特征经过池化得到一维向量,
(1.2.2)、使用卷积层,和relu层进行降维,得到最后的特征向量。
5.根据权利要求1所述的一种基于多注意力联合多级特征的行人再识别方法,其特征在于,在所述步骤(1.4)中,将预测标签和图片本身包含的类别标签进行对比,运用三元组损失和交叉熵损失作为网络的损失函数;在行人重识别中,类别标签交叉熵损失定义为:
式中,Nid表示使用图片的数量,c表示输入图像Ii的身份,s表示SoftMax函数,为全连接层的输出;
其中,所述三元组损失的具体操作步骤如下:给定三个样本I,Ip,In,其中I,Ip为相同ID的样本,I,In为不同ID的样本;三元组损失被定义为:
式中,δ为为超参数,表示正例样本对间距和负例样本对间距之间应当满足的差值;Ntp为可获得的三元组;并且其中[]+=max(·,0);
故,整个网络的总损失为:
式中,N为计算id损失的数量,M为计算三元组损失的数量;
计算卷积神经网络参数θi的梯度,再运用梯度下降法更新网络的参数;所述梯度下降法如下公式所示:
式中,L(θi)表示损失函数,以θi为参数,α表示学习率,用于控制梯度下降的速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011160779.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种橡胶软化用烟气净化装置
- 下一篇:一种多功能太阳能路灯





