[发明专利]一种基于无监督学习的行人重识别方法有效
申请号: | 202111412831.6 | 申请日: | 2021-11-25 |
公开(公告)号: | CN113822262B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 贺菁菁;徐晓刚;王军;何鹏飞;曹卫强;朱亚光 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/762;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉;杨小凡 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 行人 识别 方法 | ||
本发明公开了一种基于无监督学习的行人重识别方法,在特征存储器中只保存聚类得到的类中心,采用分组采样的方式获取小样本集,并结合难例挖掘的方法更新存储器中的特征向量和特征提取网络模型参数,实现了在无标签数据集上的伪标签自动生成,增强了模型对于噪声数据的鲁棒性,大大减小了存储器对于内存空间的高额要求。本发明剔除了离群样本点对聚类中心的干扰,避免了随机采样导致的过拟合等问题,在小样本迭代过程中不更改数据标签,降低了标签跳变等噪声数据对于模型稳定性的影响,加速了模型的收敛,提高行人重识别模型在不同场景下的泛化能力。
技术领域
本发明涉及机器学习领域,尤其是涉及一种基于无监督学习的行人重识别方法。
背景技术
在行人重识别(Person Re-identification,re-ID)任务中,利用无标签数据进行无监督学习的方法得到了广泛关注和应用。目前主流的方式是训练一个深度神经网络模型,提取行人的特征表示,再利用一个特征存储器,将行人特征向量进行实例级的存储,同时使用聚类方法为存储器中的样本生成伪标签,最后利用伪标签进行有监督的分类模型训练,更新存储器中的特征,达到模型参数更新和调整的效果。在无监督Re-ID中,实例级的特征存储器需较大的内存空间,且带有噪声的伪标签对于特征提取和分类模型都会产生消极的影响,导致模型产生过拟合,减弱泛化能力。同时,聚类得到的集群大小不同也使模型在更新过程类之间产生不一致性,当更新小集群中的所有实例时,在大集群中只能更新一小部分实例特性,难以学习到稳定的样本特征,限制了实际应用效果。
发明内容
为解决现有技术的不足,实现在无标签数据集上的伪标签自动生成,增强模型对于噪声数据的鲁棒性,大大减小存储器对于内存空间的高额要求,通过难例挖掘的方法加快模型参数更新速度,提高训练效率,结合分组采样减少类之间的不一致性,提升模型应用的泛化能力的目的,本发明采用如下的技术方案:
一种基于无监督学习的行人重识别方法,包括如下步骤:
S1,构建用于提取行人特征向量的无监督re-ID深度神经网络并初始化;包括骨干网络、全连接层,初始化深度神经网络参数、超参数、迭代训练的第一迭代终止条件参数和第二迭代终止条件参数;
S2,通过深度神经网络,获取无标签的行人图像数据作为训练集,得到对应的行人特征向量,通过聚类,将行人特征向量对应的行人图像数据,划分为多个类别,同一类行人图像数据拥有同一个伪标签,标记不归属于任何类别的行人图像数据的伪标签,通过每个类中对应的行人特征向量,获取各类中心的特征向量,进行存储并初始化;
S3,通过伪标签,重新获取训练集的行人特征向量,排除不归属于任何类的行人图像数据对应的行人特征向量;
S4,对重新获取的行人特征向量,进行分组采样,将得到的小批量样本,与存储的类中心特征向量的距离,计算分类损失,并迭代更新无监督re-ID深度神经网络和存储的类中心特征向量,直到达到第一收敛条件,包括如下步骤:
S41,对重新获取的行人特征向量,进行分组采样,得到小批量样本;
S42,以伪标签作为监督信息,计算小批量样本与存储的类中心特征向量之间的分类损失函数,使小批量样本中,根据行人图像数据提取的行人特征向量,与存储的类中心特征向量越近,与其他类中心特征向量越远;
S43,从当前迭代次数中的小批量样本中,找到其所属的部分类中,距离类中心特征向量最远的行人图像数据,通过动量法,叠加到最远的行人图像数据对应存储的原类中心特征向量上,进行一次存储器中类中心特征向量的参数更新,得到新的特征存储器中的类中心特征向量,从而实现在每一次迭代中,在线更新存储的部分类中心原本的类特征向量;
S44,若第一迭代终止条件未达到,则继续重复执行S4,若达到,则进入S5;
S5,若第二迭代终止条件未达到,则返回S2,若达到,则结束流程;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111412831.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高空作业教学装置
- 下一篇:一种海水养殖用检测报警装置