[发明专利]一种基于混合学习的跨域行人重识别方法有效
| 申请号: | 202110158298.9 | 申请日: | 2021-02-04 |
| 公开(公告)号: | CN112861705B | 公开(公告)日: | 2022-07-05 |
| 发明(设计)人: | 郭继峰;庞志奇;李林辉;李星 | 申请(专利权)人: | 东北林业大学 |
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/26;G06V10/40;G06V10/764;G06V10/82;G06K9/62;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 混合 学习 行人 识别 方法 | ||
1.一种基于混合学习的跨域行人重识别方法,其特征在于,包括如下步骤:
步骤1:设计基于生成对抗网络的风格迁移模型,利用标记的源域数据对风格迁移模型进行训练;
步骤2:设计基于特征提取网络的行人重识别模型,特征提取网络之后连接了两个分别用于监督学习和无监督学习的模块;
步骤3:设计动态权重函数动态的调整两种学习方式的权重,从而动态的对特征提取网络进行训练,最终完成跨域行人重识别任务;
所述步骤1包括如下步骤:
步骤1.1:利用现有模型对源数据和目标数据进行预处理;利用背景抑制模型对源图像进行背景抑制,得到抑制背景的图像xf;利用行人姿态估计模型对源图像的行人姿态进行提取,得到行人姿势xp;利用分割模型对目标图像中的背景进行提取,得到背景图像xb;
步骤1.2:设计基于生成对抗网络的风格迁移模型,该模型包括一个三条件生成器、一个域风格判别器和一个身份分类器,三者交替训练;对于生成器的三个输入,首先经过三个结构相同但不共享参数的编码器:E1,E2和E3之后,三组特征被连接起来输入到解码器F;值得说明的是,生成器的三个输入中,xp和xf必须是成对的,即每组xp和xf都来自同一个源图像xs;
生成器完成的三重条件映射表示为:
xg=G(xp,xf,xb)
其中G表示参数化的生成器,xg为生成图像,其同时具有目标域的背景和源域的行人主体,除此之外它还保留了原身份;
判别器和分类器实质上都是由卷积网络组成的二分类器和多分类器,其中设计判别器的目的是使生成器生成具有目标风格的图像,而设计分类器的目的是使生成图像能够保留原始行人身份;
所述步骤2包括如下步骤:
步骤2.1:使用在ImageNet上预训练的ResNet-50作为特征提取模型,取消了平均池化层之后的1000维全连阶层以及softmax激活层,并对平均池化层输出的一个2048维向量进行归一化;
步骤2.2:利用收敛后的生成器和预处理后的数据生成大量具有目标域风格和源域身份的行人图像;设计基于身份分类模型的监督学习模块,模型利用生成图像进行训练,同时对特征提取网络进行训练;
步骤2.3:利用先验知识即“源域和目标域的行人身份没有重合”在源域和目标域中选取负样本对;利用特征距离和比较特征距离在目标域上挖掘正样本对;
步骤2.4:设计基于度量的无监督学习模块,基于正负样本对对度量模块进行训练,同时调整特征提取模型;
所述步骤3包括如下步骤:
步骤3.1:设计动态权重函数动态的调整两个模块的训练过程,从而动态的对特征提取网络进行训练;把监督学习模块中使用的分类损失指定为主损失,计算主损失在当前迭代的变化率:
其中Li表示主损失在第i次迭代的值,之后,定义了主损失的动态权重:
其中λi为第i次迭代中主损失的权重,γ是聚焦强度,最后根据主损失的权重确定无监督模块的权重;
步骤3.2:利用收敛后的特征提取网络完成跨域行人重识别任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110158298.9/1.html,转载请声明来源钻瓜专利网。





