[发明专利]一种基于深度特征学习的行人再识别方法有效
| 申请号: | 201810191123.6 | 申请日: | 2018-03-08 |
| 公开(公告)号: | CN108345866B | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | 刘爽;郝晓龙;张重 | 申请(专利权)人: | 天津师范大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 陈超 |
| 地址: | 300387 *** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 特征 学习 行人 识别 方法 | ||
1.一种基于深度特征学习的行人再识别方法,其特征在于,所述方法包括:
步骤S1,构建深度神经网络模型;
步骤S2,获取训练图像集,将所述训练图像集中的每幅训练图像分为N个水平部分,并为每个水平部分分配一个类别标签;
步骤S3,利用带有类别标签的水平部分训练所述深度神经网络模型;
步骤S4,获取测试图像集,将测试图像集中的每幅测试图像分为N个水平部分;
步骤S5,利用训练好的深度神经网络模型提取所述测试图像集中每幅测试图像水平部分的特征,并将每部分特征串联形成相应图像最终的特征;
步骤S6,获取待识别图像及其特征,并基于待识别图像与测试图像的特征计算待识别图像与每幅测试图像之间的相似度得分;
步骤S7,对相似度得分进行排序,得分最高的测试图像被认为与所述待识别图像是相同行人,进而得到待识别图像的行人再识别结果;
所述步骤S2包括以下步骤:
步骤S21,将每幅训练图像从上至下无重叠地分为N个水平部分;
步骤S22,为每个水平部分分配类别标签,每个水平部分的类别标签qpgr(k,n)表示为:
其中,n∈{1,2,...,N}表示训练图像中第n个水平部分,N是训练图像中水平部分的数量,k表示整幅图像预测的类别标签,y表示整幅图像真实的类别标签,K表示行人类别数量,ε∈[0,1]是一个光滑参数,α1是一个超参数。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括以下步骤:
步骤S11,利用预设残差网络结构初始化所述深度神经网络的参数;
步骤S12,把所述深度神经网络中最后一个全连接层的神经元个数替换为K个,其中K为正整数,为行人类别的数量;
步骤S13,在全连接层后设置柔性最大单元;
步骤S14,在柔性最大单元后构建损失函数,得到所述深度神经网络模型。
3.根据权利要求1所述的方法,其特征在于,所述步骤S3包括以下步骤:
步骤S31,将带有类别标签的水平部分归一化到像素大小为p×p,其中p为正整数;
步骤S32,利用归一化的水平部分及其对应的类别标签训练所述深度神经网络模型。
4.根据权利要求3所述的方法,其特征在于,所述步骤S32包括以下步骤:
步骤S321,把归一化的水平部分及其类别标签送入所述深度神经网络模型进行前向传播;
步骤S322,在前向传播结束后进行反向传播。
5.根据权利要求4所述的方法,其特征在于,所述步骤S321包括以下步骤:
步骤S3211,设置深度神经网络模型训练参数;
步骤S3212,设置所述深度神经网络模型的损失函数;
步骤S3213,通过所述损失函数和深度神经网络模型参数计算得到前向传播损失值。
6.根据权利要求5所述的方法,其特征在于,所述损失函数Lpgr(n)可设置为:
其中,p(k)表示某一水平部分被预测为第k类的概率。
7.根据权利要求5所述的方法,其特征在于,所述步骤S3212之后还包括对于损失函数进行简化的步骤。
8.根据权利要求1所述的方法,其特征在于,所述步骤S5包括以下步骤:
步骤S51,将所述测试图像的水平部分归一化为p×p大小;
步骤S52,利用训练好的深度神经网络模型提取所述测试图像集中每幅测试图像水平部分的特征;
步骤S53,将每部分的特征串联起来形成最终的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津师范大学,未经天津师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810191123.6/1.html,转载请声明来源钻瓜专利网。





