[发明专利]一种基于困难五元组的跨模态行人重识别方法在审

申请号：	202010250662.X	申请日：	2020-04-01
公开（公告）号：	CN111597876A	公开（公告）日：	2020-08-28
发明（设计）人：	赵云波;林建武;唐敏;李灏	申请（专利权）人：	浙江工业大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司：	杭州天正专利事务所有限公司 33201	代理人：	王兵;黄美娟
地址：	310014 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于困难五元组跨模态行人识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于困难五元组的跨模态行人重识别方法，含有以下步骤：

(1)构建跨模态行人重识别模型；

步骤11：预训练行人重识别卷积神经网络；

训练MGN、BFE、Res-Mid、PCB、MLFN五种卷积神经网络；对于每种卷积神经网络，在RGB-RGB行人重识别的Market-1501数据集上进行预训练；使用困难三元组损失函数和身份损失函数来训练网络；

步骤12：重构行人重识别卷积神经网络：

改造现有的单模态行人重识别卷积神经网络，使其在跨模态行人重识别数据集(SYSU-MM01数据集)上适用，使用在单模态行人重识别数据集上表现优异的卷积神经网络模型作为本发明中的特征提取模块；

典型的单模态行人重识别卷积神经网络中，图像经过CNN模块得到特征图，特征图转成一维向量后添加一层全连接层(FC-1)，FC-1的输出表示该图像的特征向量；为了使该特征向量具有表征性，使用排序损失(Ranking loss)和身份损失(Identity loss)进行约束；

(2)选取困难五元组集和；

步骤21：选取训练批次图像；

设计一种针对跨模态行人重识别的训练批次选择方案；具体地，每个训练批次(Batch)中，在训练集中随机选择P个不同身份的行人，每个行人随机选择K张红外图片和K张RGB图片，一个Batch共计2PK张图片；

步骤22：提取特征向量；

采用卷积神经网络做为特征提取模块，由于卷积神经网络在图像领域强大的特征提取能力，能够从图像中提取具有表征性的特征向量；2PK张图片经过该模块，得到了2PK个特征向量；

步骤23：选取困难五元组集和；

对步骤22中得到的2PK个特征向量进行困难采样，得到困难五元组集和遍历每一张图片，为每一张图片采样一组困难五元组，i∈[1,2PK]；具体地，将第i张图片作为锚点在该训练批次中，选取作为最难全局负样本，即与锚点身份不同的同模态图像或跨模态图像，并且该图像与锚点的欧式距离最小；选取作为最难全局正样本，即与锚点身份相同的同模态图像或跨模态图像，并且该图像与锚点的欧式距离最大；选取作为最难跨模态负样本，即与锚点身份不同的跨模态图像，并且该图像与锚点的欧式距离最小；选取作为最难跨模态正样本，即与锚点身份相同的跨模态图像，并且该图像与锚点的欧式距离最大；遍历2PK中的每一张图像，即将每一张图像作为锚点进行困难五元组采样，将得到2PK个困难五元组(3)训练跨模态行人重识别模型：

步骤31：困难五元组损失训练网络：

根据步骤23中得到的困难五元组集和设计一种困难五元组损失函数(hard pentaplet loss)，该损失函数由两部分组成：困难全局三元组损失函数和困难跨模态三元组损失函数；

将两张图片x_i和x_j的欧式距离记为d(x_i,x_j)＝||f(x_i)-f(x_j)||₂，其中f(x_i)和f(x_j)分别代表图片x_i和x_j的特征向量；

为了减小行人图像在欧式空间的类内距离，并增大类间距离；设计困难全局三元组损失函数，记为：

其中，[z]₊＝max(z,0)，表示锚点与最难正样本间的欧式距离(欧式距离最大)，表示锚点与最难负样本间的欧式距离(欧式距离最小)，α是一个超参数，保证训练后的锚点与负样本间的距离大于与正样本间的距离，并保持α的冗余度；

在跨模态行人重识别中，模态间的变化往往大于模态内的变化，设计困难跨模态三元组损失函数，记为：

其中，表示锚点与最难跨模态正样本间的欧式距离(欧式距离最大)，表示锚点与最难跨模态负样本间的欧式距离(欧式距离最小)；当a≥K时，A＝{1,2,...,K}，否则，A＝{K+1,K+2,...,2K}；其余符号与公式1含义一致；该损失函数有助于减小模态间的变化；

困难五元组损失函数为困难全局三元组与困难跨模态三元组损失函数之和：

L_hp＝L_hgt+L_hct (3)

经过困难五元组损失函数的训练后，锚点与正样本间的距离减小，与负样本间的距离拉大；此外，该损失函数额外地关注模态间的变化，有助于减小不同模态相同身份行人在欧式空间中的距离；

步骤32：身份损失训练网络：

使用身份损失(Identity loss)来减小类内变化；将不同模态内的相同身份的行人视作为同一类，并用softmax loss表示：

其中，f为FC-2的输出向量，j∈[1,H]，f_j表示FC-2输出向量中第j个元素；y_i是输入图像x_i的标签，指x_i在输出向量中的得分。

2.如权利要求1所述的一种基于困难五元组的跨模态行人重识别方法，其特征在于：步骤11所述的在RGB-RGB行人重识别的Market-1501数据集上进行预训练，具体包括：在Market-1501数据集上训练180个epoch，batch size设置为64，学习率设置为0.0003，困难三元组损失的冗余度参数设置为0.9；

步骤12所述的使用排序损失(Ranking loss)和身份损失(Identity loss)进行约束，具体包括：Ranking loss采用度量学习的思想，来减少类内距离和类间距离，所述的Ranking loss是困难五元组损失(hard pentaplet loss)；Identity loss采用交叉熵损失，将每个身份的行人作为一类，来减小类内距离，FC-2是全连接层，其神经元个数为训练集中行人身份的个数，根据SYSU-MM01训练集中的行人身份数量，将FC-2的神经元个数设置为395。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010250662.X/1.html，转载请声明来源钻瓜专利网。

上一篇：网络训练方法、数据识别方法、装置、设备和介质
下一篇：一种物品推荐方法、装置以及介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于困难五元组的跨模态行人重识别方法在审

专利文献下载