[发明专利]一种基于深度度量的行人再辨识方法有效
申请号: | 201910626883.X | 申请日: | 2019-07-11 |
公开(公告)号: | CN110516533B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 苗夺谦;王倩倩 | 申请(专利权)人: | 同济大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/74;G06V10/82;G06V10/77;G06N3/0464;G06N3/08 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 叶凤 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 度量 行人 辨识 方法 | ||
1.一种基于深度度量的行人再辨识方法,其特征在于,包括以下步骤:
一、构建网络
1)预训练ResNet-50网络,
将ImageNet数据集作为训练数据集,训练一个ResNet-50网络,使其具有初始值;
2)调整步骤1)ResNet-50网络,移除ResNet-50网络中的softmax层以及最后一个全连接层;提供给步骤4);
3)采用多个非线性全连接层构成深度度量网络,并在输出后增加欧氏距离计算单元,该部分网络参数采用随机初始化方法;提供步骤4);
步骤4)构建行人再辨识网络模型,具体如下:
将步骤2)中调整后的ResNet-50网络与步骤3)中获得的深度度量网络相连接,即将ResNet-50网络的输出输入到深度度量网络中,构建的行人再辨识网络模型;
二、训练
5)预处理行人再辨识训练数据集,将训练数据集中的图像进行随机剪裁,得到一组尺寸为224×224的训练数据集,从中随机选择P位不同的行人,并为每个行人随机选择K张图像,组成小的训练批;
6)训练网络模型,
通过最小化Hard Triplet Loss损失函数对步骤4)中最终构建的网络模型进行优化,使用步骤5)中所得的训练数据输入该优化的网络模型,循环执行此步骤,直至损失值收敛;
三、识别
7)进行行人再辨识,将待辨识行人图像和候选库中的图像分别输入到步骤6)已优化的网络模型中,获取行人图像在同一个特征空间上的特征向量;
8)计算待辨识图像与候选库中所有图像的相似度,即计算待辨识图像与候选库图像间特征向量的欧氏距离,其中特征向量由步骤7)获取;然后按照相似度从小到大的规则,对候选库中的图像进行排序,排位越靠前图像与待辨识图像越相似;其中相似指的是两张行人图像为同一行人的图像。
2.根据权利要求1所述的一种基于深度度量的行人再辨识方法,其特征在于,步骤1)所述的预训练ResNet-50网络,采用dropout或Batch Normalization方法对训练进行优化,使得ResNet-50网络具备图像特征提取能力。
3.根据权利要求1所述的一种基于深度度量的行人再辨识方法,其特征在于,步骤2)所述的调整ResNet-50,是将ResNet-50网络的softmax层和最后一个全连接层删去,获得最终输出为2048维的向量。
4.根据权利要求3所述的一种基于深度度量的行人再辨识方法,其特征在于,步骤3)所述的深度度量网络其接入所述的2048维特征向量,输出非线性投影后的欧式空间特征向量;所述深度度量网络结构具体为:
在一个由M个非线性全连接层构成的神经网络后,增加一个欧式距离计算层;其中第一个全连接层的深度为2048,各个层的参数初始化采用随机初始化的方法,计算公式如下:
其中1≤m≤M,r(m)为第m层的深度,且r(0)=2048,是第m层的权重,每层的偏置初始化为零向量,M为深度度量网络中全连接层的总层数,为超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910626883.X/1.html,转载请声明来源钻瓜专利网。