[发明专利]一种基于深度多索引哈希的行人重识别方法有效

申请号：	201910166071.1	申请日：	2019-03-06
公开（公告）号：	CN109919084B	公开（公告）日：	2023-04-25
发明（设计）人：	李武军;李明威;蒋庆远	申请（专利权）人：	南京大学
主分类号：	G06V40/10	分类号：	G06V40/10;G06V10/764;G06V10/82;G06N3/0464;G06N3/084
代理公司：	南京乐羽知行专利代理事务所(普通合伙) 32326	代理人：	孙承尧
地址：	210023 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度索引行人识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度多索引哈希的行人重识别方法，其特征在于，该方法包括以下的步骤：

1)基于行人区域检测技术，从原始视频数据中构造行人图片训练集；

2)基于行人图片训练集，构建并训练多粒度网络模型，得到哈希函数以及训练集图片对应的实值特征和哈希编码；

将行人图片作为多粒度网络模型的输入，学习行人图片的实值特征表示和哈希编码；多粒度网络模型以ResNet-50作为主干，包括五层卷积神经网络，一层全局池化层，一层维度压缩层，一层哈希层，其中第五层卷积神经网络将原始的ResNet-50划分为：全局分支、上下身分支、上中下身分支；

在训练和测试的过程中将三个分支的输出进行合并从而得到行人图片的实值特征表示，这样的特征表示蕴含了多粒度的行人信息；对于每一个分支，在特征表示层后添加一层全连接层作为哈希层，哈希层的维度对应于哈希编码的长度；在多粒度网络模型的训练过程中，使用归一化指数函数损失为行人图片的实值特征表示建模，使用三元组损失为行人图片的哈希编码建模，使用多索引查询敏感损失来为检索进行加速；在求解时，使用梯度反向传播优化深度网络的参数；

多粒度网络模型的目标函数由三部分组成，对于第i个输入图片x_i，令{f_i⁽¹⁾,f_i⁽²⁾,f_i⁽³⁾}表示多粒度网络模型输出的实值特征表示，令{d_i,g_i,h_i}表示对应的离散二值编码，其中d_i,g_i,h_i∈{-1,+1}^r，r为单个分支输出的哈希编码的长度，规定[]^T表示向量的转置，[x]₊表示函数max(0,x)，∥b_i-b_j∥_H表示二值向量b_i和b_j之间的海明距离：