[发明专利]一种迭代非对称互学习哈希行人再识别方法和系统在审
申请号: | 202310070455.X | 申请日: | 2023-01-20 |
公开(公告)号: | CN115965997A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 邓若愚;胡尚薇 | 申请(专利权)人: | 同济人工智能研究院(苏州)有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/774;G06V10/82 |
代理公司: | 苏州见山知识产权代理事务所(特殊普通合伙) 32421 | 代理人: | 袁丽花 |
地址: | 215000 江苏省苏州市相城区高*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 迭代非 对称 学习 行人 识别 方法 系统 | ||
本申请提供一种迭代非对称互学习哈希行人再识别方法和系统,方法包括以下步骤:对于行人再识别数据集,将训练集中的行人图像进行数据预处理;将预处理后的行人图像同时输入到教师模型与学生模型中,同时根据教师模型的特征图计算激活图并转化为显著区域分数;将得到的显著区域分数输入学生模型中,并将自蒸馏量化损失最小化,优化目标函数;计算学生模型与教师模型的预测差异,进行显著性引导的迭代非对称互学习训练;将测试集中的行人图像送入学生模型得到测试集样本的哈希编码,结合候选集的哈希编码,计算汉明距离,输出排序结果。本申请对于真实场景中的行人匹配效率可以起到显著的提升效果,适合于行人再识别实时匹配的应用场景。
技术领域
本申请涉及计算机视觉领域,尤其是涉及一种显著性引导的迭代非对称互学习哈希行人再识别方法和系统。
背景技术
目前的行人再识别技术大多基于实值特征进行特征匹配,旨在提升公开数据集上的匹配精度,而实值特征基于欧氏距离进行度量相当耗时,同时现有的行人再识别方法大多依靠高维的特征取得理想的匹配精度,然而这也进一步使得匹配阶段的耗时更为严重,尤其是当数据集规模逐步变大时,耗时将会出现指数级别的增长,因此现有的实值方法忽略了实际场景中所面临的实时检索效率问题。同时高维实值特征带来的另一个问题是存储消耗,海量的高维度特征将会造成严重的内存消耗,这在现实场景中也是难以接受的。
相比之下,哈希特征由于其为二值化的编码结果,在匹配效率以及存储空间上展现出巨大优势,近年来被逐步应用于行人再识别领域以实现快速图像检索。然而虽然哈希编码在匹配效率以及存储方面存在优势,由于哈希编码本身的二值化特点,其表征能力较弱,而行人图像相比于常规的图像分类任务,其特征所需要包含的信息需要更加丰富且细粒度,因此粗暴地对高维浮点数实值特征进行二值化无法满足该任务的性能需求。因此现有的深度哈希方法与实值方法仍然存在较大的性能鸿沟,使得这些方法仍然与实际场景中的落地应用存在较大差距。
基于此,本申请提出了一种显著性引导的迭代非对称互学习哈希行人再识别方法,可以有效缩小实值特征和哈希特征之间的性能差距。
发明内容
为了提升现有行人再识别方法的匹配效率与性能,使得现有方法可以满足真实场景中所需的实时性匹配要求,本申请提供一种基于相机风格域适应的迭代非对称互学习哈希行人再识别方法和系统。
本申请的目的可以通过以下技术方案来实现:
一种基于相机风格域适应的迭代非对称互学习哈希行人再识别方法,包括以下步骤:
对于行人再识别数据集,将训练集中的行人图像进行数据预处理;
将预处理后的行人图像同时输入到教师模型与学生模型中,同时根据教师模型的特征图计算激活图并转化为显著区域分数;
将得到的显著区域分数输入学生模型中,并将自蒸馏量化损失最小化,优化目标函数;
计算学生模型与教师模型的预测差异,进行显著性引导的迭代非对称互学习训练;
将测试集中的行人图像送入学生模型得到测试集样本的哈希编码,结合候选集的哈希编码,计算汉明距离,输出排序结果。
进一步地,所述预处理包括:将训练集中的行人图像读取到内存中,首先进行归一化处理,即将其像素值转化为均值为0,方差为1;再使用随机擦除、边界扩充操作进行数据增强;最后将增强后的数据转化为Pytorch深度学习框架支持的数据格式。
进一步地,所述显著性引导的迭代非对称互学习训练,包括:
学生模型使用教师模型的多个视角产生的输出进行训练,包含特征图、实值特征和哈希编码;
最小化学生模型和教师模型的成对激活相似度差异,其形式如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济人工智能研究院(苏州)有限公司,未经同济人工智能研究院(苏州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310070455.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:功率模块的散热系统
- 下一篇:一种基于人工智能的沉浸式数智音乐治疗控制系统