[发明专利]一种基于正样本平衡约束的深度行人再标识方法有效
申请号: | 201710330206.4 | 申请日: | 2017-05-11 |
公开(公告)号: | CN107330355B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 黄俊艺;任传贤 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 样本 平衡 约束 深度 行人 标识 方法 | ||
本发明提供一种基于正样本平衡约束的深度行人再标识方法,该方法使用的残差网网络结构简洁并且得到广泛应用,足够深的网络结构增强了特征表达能力,并且不需要对网络结构进行特别设计;发现用残差网分类器进行图像特征提取,行人再标识的准确率便可以高于大部分的精心设计的方法;相比于二元组损失和三元组损失的方法,提升结构损失不需要特意生成有效的样本便可以达到类似的效果,并且利用整体的分布信息,学习到的梯度方向更加稳健有效;在提升结构损失的基础上,增加了正样本平衡约束,不仅可以控制正样本对的距离,并且可以平衡正样本对距离和负样本对距离的梯度,使得算法更容易训练以及提升算法性能。
技术领域
本发明涉及深度学习与行人再标识领域,更具体地,涉及一种基于正样本平衡约束的深度行人再标识方法。
背景技术
这些年来,模式识别、机器学习、计算机视觉研究领域取得了令人印象深刻的进步。这些进步吸引了视频监控、法律安全行业的注意,同时该行业也对这些智能算法以及智能系统的需求也在不断地增加。在安全行业的不断发展的作用下,用于人脸监测、指纹监测、其他生物特征监测以及人和城市环境的智能监测工具得到了广泛的应用。这些工具收集了大量的数据,通常以图像或者视频的形式存在,为机器学习领域带来了新的研究课题,而在近年来引起学术界较大兴趣的课题则是行人再标识。
总的来说,处理行人再标识问题有两类方法,分别是传统方法和深度学习方法。传统方法一般而言需要设计或者学习出稳健的并且具有判别性的特征,大多数是浅层模型,特征表达能力有限;而深度学习网络可以通过学习权重而达到自动学习到需要观察哪一些有效的特征,不需要如传统的方法需要人工设计特征,最近两三年来,开始越来越多的研究者用深度学习方法去解决行人再标识问题,并且取了不错的进展。不过,现在的深度学习方法大多利用数据局部分布的信息,并且还是使用较少的隐藏层,网络相对不深,因此算法性能上还有明显提升空间。
发明内容
本发明提供一种提升了特征表达能力的基于正样本平衡约束的深度行人再标识方法。
为了达到上述技术效果,本发明的技术方案如下:
一种基于正样本平衡约束的深度行人再标识方法,包括以下步骤:
S1:输入数据训练数据集其中,N是样本数量,d是图像像素,c是训练集中不同行人的数量,xi是d维的列向量,yi=[yi1,yi2,yi3,…,yic]T是c维的列向量,其中的元素等于1或0,并且X=[x1,x2,x3,…,xN],X是d行N列的矩阵;
S2:使用softmax分类模型对网络进行预训练;
S3:使用基于正样本平衡约束的提升结构损失对网络进行训练;
S4:对测试样本图像进行特征提取;
S5:利用得到的特征对测试样本进行最近邻KNN分类进而得到再标识结果。
进一步地,所述步骤S2的具体过程是:
设置网络的训练学习率η和epoch最大次数T,并且使用softmax分类模型对网络参数W进行预训练,训练的方法为反向传播算法,具体的步骤如下所示:
首先初始化网络参数W;若当前epoch次数少于T,则生成迷你批数据然后把输入到网络进行向前传播计算,计算得到该次迭代的损失函数值然后根据进行向后传播计算,计算梯度最后进行网络参数更新网络参数根据该规则进行不断更新,直到epoch次数等于T。
进一步地,所述步骤S3的具体过程是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710330206.4/2.html,转载请声明来源钻瓜专利网。