[发明专利]一种基于GAN的无监督自适应行人重识别方法有效
申请号: | 201911234544.3 | 申请日: | 2019-12-05 |
公开(公告)号: | CN110929679B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 殷海兵;郑声晟;章天杰;黄晓峰 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06V10/762;G06V10/764;G06V10/774;G06V10/82 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gan 监督 自适应 行人 识别 方法 | ||
1.一种基于GAN的无监督自适应行人重识别方法,其特征在于,包括如下步骤:
步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,包括如下步骤:
(1)将待识别的行人图片输入所述CNN模型的骨干网络中;
(2)将所述骨干网络中最后一个全局池化层产生的全局池化特征输入到批量归一化层中生成最终的特征表示;
(3)使用一个全连接层,对所述最终的特征表示执行行人的ID分类;
(4)通过softmax对所述全连接层的分类结果进行归一化处理;
步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过所述伪标签训练所述CNN模型,包括如下步骤:
(1)利用在源域上训练好的所述CNN模型提取无标签目标数据集的特征,获得大小为mt×mt的矩阵Mij,其中Mij=||xi-xj||2为矩阵中xi和xj之间的距离,mt表示Mij矩阵的大小,其值为所述目标数据集图片总数,xi、xj表示矩阵Mij中的元素,源数据集与目标数据集之间的距离矩阵表示为:
d(xi,xj)=(1-λ)dJ(xi,xj)+λ(dW(xi)+dW(xj))
所述λ∈[0,1]表示平衡参数,所述NS(xi)表示源数据集S与xi最近的元素;
(2)采用DBSCAN进行聚类,获得伪标签;
D=DBSCAN(MST,τ,n)
所述D表示数据,包括图片及其伪标签,所述τ为半径,其取值为所述MST内前1.6‰元素的平均值,所述n为密度阈值;
(3)通过所述聚类获得的伪标签训练所述CNN模型;
通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型,包括如下步骤:
(a)训练阶段,根据所述聚类结果,对所述聚类中的各个不同ID的行人图片数量进行统计;取出每个类中相同ID行人图片数量最多的行人相应的图片,并计算人体关键点生成热图;挑选质量合格的图片进行同一ID行人不同姿势的图片随机配对训练所述GAN;
(b)生成阶段,从所述训练阶段选定一组规范姿势,利用训练好的所述GAN将目标数据集图片生成对应规范姿势的图片,将所述生成对应规范姿势的图片与所述目标数据集图片一起放入所述自训练的聚类中;
(c)调整阶段,根据生成阶段的所述自训练的聚类结果,找出每一个类中,图片数量最多的行人身份ID,若某一ID的行人图片数量占比最多的类存在多个,则进行聚类调整,将调整后的结果作为所述伪标签放入所述自训练中对所述CNN模型进行训练;所述聚类调整,以生成的规范姿势图片为纽带,将同一ID图片错分的多个类重新合并成一个类;具体地,对于某个ID的行人图片数量占比最多的多个类,若某个类中存在由其他类中目标数据集图片生成的规范姿势图片,则将该类和其他类合并成一类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911234544.3/1.html,转载请声明来源钻瓜专利网。