[发明专利]一种基于GAN的无监督自适应行人重识别方法有效
申请号: | 201911234544.3 | 申请日: | 2019-12-05 |
公开(公告)号: | CN110929679B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 殷海兵;郑声晟;章天杰;黄晓峰 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V10/762;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gan 监督 自适应 行人 识别 方法 | ||
本发明公开了一种基于GAN的无监督自适应行人重识别方法,包括如下步骤:步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,通过采用批量归一化、一个全连接层、Adam优化器代替SGD,共同作用来训练CNN模型,解决了在源数据集上预训练CNN模型基线性能不足的问题;步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型。
技术领域
本发明涉及智能监控领域,尤其是涉及了一种基于GAN(Generative AdversarialNetworks,生成式对抗网络)的无监督自适应行人重识别方法。
背景技术
随着城市人口的不断增长和视频监控系统的大量普及,社会公共安全问题越来越受到人们的重视。为了增强摄像头网络的安防水平,行人重识别技术在人员检索上也得到了广泛关注。行人重识别,也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。当前行人重识别方法主要通过基于特定场景下大量带标签的视频图像数据训练出一个稳定可靠的模型,但是这类监督学习方法忽略了在实际应用中系统对新场景的适应性,并且依赖于大量带标签的行人数据,而标签工作往往需要耗费大量的人力和物力,不利于系统的部署。此外由于行人图像都存在光照变化,视角姿势变化与遮挡等诸多挑战,仅仅利用无标签的数据进行无监督学习也难以达到令人满意的性能。
近年来,随着迁移学习研究的深入和发展,通过迁移学习算法思想,将在带标签源数据集上训练所得的网络模型应用到无标签目标数据集的学习任务中,从而实现了较高的识别准确率。但当前迁移学习主要解决不同数据域存在共同类别的问题,行人重识别在不同场景往往不存在相同的行人,故难以直接应用于解决行人重识别问题。因此如何利用旧场景的带标签行人数据以及新场景下的无标签行人数据进行迁移学习,从而实现在新场景下的高识别准确率是目前亟待解决的问题。
该方法提出了一种适用于无监督域自适应重识别(Re-identification,reID)任务的新型自训练方案,分为源域训练和自训练两部分。首先进行源域训练,即在带有标签的源数据集上预训练CNN(Convolutional Neural Networks,卷积神经网络)模型,或称特征提取器。然后进行自训练,采用预训练的CNN模型提取无标签目标数据集的特征并聚类猜测目标数据,最后基于聚类得到的伪标签来训练CNN模型。但是该方法会导致识别准确率不高的缺陷有两点,一是在源数据集上预训练CNN模型基线性能不足,二是在自训练聚类猜测目标数据标签的过程中聚类的效果不佳导致reID识别准确率较低。
发明内容
为解决现有技术的不足,实现更高识别准确率的目的,本发明采用如下的技术方案:
一种基于GAN的无监督自适应行人重识别方法,包括如下步骤:
步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,包括如下步骤:
(1)将待识别的行人图片输入所述CNN模型的骨干网络中;
(2)将所述骨干网络中最后一个全局池化层产生的全局池化特征输入到批量归一化层中生成最终的特征表示;批量归一化可以提供更稳定的梯度,这减轻了对预训练模型的不必要干扰,在实验中,批量归一化通常会有更快的收敛速度和更好的性能。
(3)使用一个全连接层,对所述最终的特征表示执行行人的ID分类;传统的方法有两个全连接层,删除第一个全连接层以提高最终效果,同时,由于减少了第一个全连接层,在softmax损失的梯度可以直接返回到卷积层,有利于减轻过度拟合的问题,以确保测试性能;
(4)通过softmax对所属全连接层的分类结果进行归一化处理;
步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过所述伪标签训练所述CNN模型,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911234544.3/2.html,转载请声明来源钻瓜专利网。