[发明专利]一种迭代非对称互学习哈希行人再识别方法和系统在审
申请号: | 202310070455.X | 申请日: | 2023-01-20 |
公开(公告)号: | CN115965997A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 邓若愚;胡尚薇 | 申请(专利权)人: | 同济人工智能研究院(苏州)有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/82 |
代理公司: | 苏州见山知识产权代理事务所(特殊普通合伙) 32421 | 代理人: | 袁丽花 |
地址: | 215000 江苏省苏州市相城区高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 迭代非 对称 学习 行人 识别 方法 系统 | ||
1.一种迭代非对称互学习哈希行人再识别方法,其特征在于,包括以下步骤:
对于行人再识别数据集,将训练集中的行人图像进行数据预处理;
将预处理后的行人图像同时输入到教师模型与学生模型中,同时根据教师模型的特征图计算激活图并转化为显著区域分数;
将得到的显著区域分数输入学生模型中,并将自蒸馏量化损失最小化,优化目标函数;
计算学生模型与教师模型的预测差异,进行显著性引导的迭代非对称互学习训练;
将测试集中的行人图像送入学生模型得到测试集样本的哈希编码,结合候选集的哈希编码,计算汉明距离,输出排序结果。
2.根据权利要求1所述的一种协作多特征聚类无监督行人再识别方法,其特征在于,
所述预处理包括:将训练集中的行人图像读取到内存中,首先进行归一化处理,即将其像素值转化为均值为0,方差为1;再使用随机擦除、边界扩充操作进行数据增强;最后将增强后的数据转化为Pytorch深度学习框架支持的数据格式。
3.根据权利要求1所述的一种协作多特征聚类无监督行人再识别方法,其特征在于,
所述显著性引导的迭代非对称互学习训练,包括:
学生模型使用教师模型的多个视角产生的输出进行训练,包含特征图、实值特征和哈希编码;
最小化学生模型和教师模型的成对激活相似度差异,其形式如下所示:
其中Fs,Ft分别为教师模型和学生模型的特征图,F为弗罗贝尼乌斯范数;
所述教师模型和学生模型的实值特征从三个角度进行优化:分类分数、成对相似度、余弦相似度。
4.根据权利要求1所述的一种迭代非对称互学习哈希行人再识别方法,其特征在于,
所述将得到的显著区域分数输入学生模型中,包括:
根据所述显著区域分数进行显著性引导的自蒸馏过程,使得学生模型依据图像中存在的判别区域生成紧实值特征编码。
5.根据权利要求4所述的一种迭代非对称互学习哈希行人再识别方法,其特征在于,
所述教师模型包括显著性生成模块、GAP层和分类模块,所述显著性引导的自蒸馏过程,包括:
来自教师模型两个分支的特征图首先相加并平均,随后输入显著性生成模块用于生成激活图,所述激活图通过softmax函数转换成概率图,其中值低于阈值的位置被设置为0,随后带权图进行大小调整并与学生模型的特征图进行矩阵相乘;
所述GAP层将所述矩阵相乘的结果转换为向量,所述分类模块的分类结果被用于生成伪标签对另一GAP分支的训练进行显式指导。
6.根据权利要求1所述的一种迭代非对称互学习哈希行人再识别方法,其特征在于,
所述教师模型包括多样化划分模块和划分编码模块;
所述多样化划分模块包含全局分支和局部分支;所述全局分支包括两个分支,即一个批次归一化层和分类层;所述局部分支包括两个分支,分别对初始的特征图从水平和竖直方向进行三等分和两等分划分,5个子特征链接起来作为最终局部分支的输出;所述全局分支和局部分支的特征进行链接输入划分编码模块,将实值特征划分为多份并将划分后的特征分别映射为一维向量,将所述一维向量链接为最后的输出。
7.根据权利要求1所述的一种迭代非对称互学习哈希行人再识别方法,其特征在于,
所述自蒸馏量化损失为相对熵损失和贪心损失之和;
所述相对熵损失Lkl(m1,m2)计算方式如下:
其中m1,m2分别代表实值特征和哈希特征的预测结果,Nd为批次大小,ci代表第i个类别;
所述贪心损失Lgr计算方式如下:
其中p表示p范式,H/B分别为实值特征与哈希特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济人工智能研究院(苏州)有限公司,未经同济人工智能研究院(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310070455.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:功率模块的散热系统
- 下一篇:一种基于人工智能的沉浸式数智音乐治疗控制系统