[发明专利]一种无监督数据驱动的行人重识别方法有效
申请号: | 201910421379.6 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110502964B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 范影乐;王辉阳;武薇 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种无监督数据驱动的行人重识别方法;首先构建并实现对轻量级行人重识别网络的预训练;接着利用行人重识别网络中的特征提取模块对来自实际场景的无标签数据进行特征提取;并通过特征的级联排序,利用数据特征对的排序列表以及列表中元素的二级排序列表的相似度,挖掘数据特征之间的相似关系,根据聚合度指标对有效的无标签数据进行行人身份标注;然后将自动标注身份的无监督数据随机替代原训练集的部分数据,实现对训练集的更新;最后利用更新后的训练集实现行人重识别网络的重新学习。本发明对实际应用场景无标签数据集进行类别自动标注,使行人重识别模型具有适应新应用场景的能力,改善了行人重识别模型的泛化特性。 | ||
搜索关键词: | 一种 监督 数据 驱动 行人 识别 方法 | ||
【主权项】:
1.一种无监督数据驱动的行人重识别方法,其特征在于,该方法具体包括以下步骤:/n步骤1:构建具有可持续学习能力的行人重识别网络,该网络由特征提取和分类两个模块构成,特征提取模块包括3个卷积层、6个inception中间层以及1个特征输出层,其中inception结构中增加5×3卷积核以适应行人特征的长宽比特性;分类模块则对应于行人身份识别层。网络中的卷积层和特征输出层的输出都需要经过批量归一化和relu函数激活,行人身份识别层的输出则需经过softmax函数激活。/n步骤2:利用来自实验场景的有标签行人数据对训练集进行初始化,然后对步骤1中构建的行人重识别网络进行预训练,实现网络参数的初始化。网络的损失函数Loss选择交叉熵算法,如式(1)所示,在训练过程中,采用基于动量的梯度下降法更新优化网络参数。/n /n其中yij∈{0,1},为已知的二值标签,表示训练集第i个数据是否对应于第j个行人身份,取“1”值时表示对应,取“0”值表示不对应; 为行人重识别网络的输出,表示训练集第i个数据是否对应于第j个行人身份的预测概率值;M,N分别表示训练集行人数据总数和不同行人身份总数。/n步骤3:在实际应用场景下,构建实时采集的无标签行人数据集,数据总数记为Munlabel。针对步骤2中完成预训练的行人重识别网络,输入无标签行人数据集中的第i个数据,得到行人重识别网络中特征提取模块的输出,即对应于第i个无标签行人数据的特征,记为1024维特征向量 /n步骤4:根据步骤3提取的无标签行人数据特征向量,计算级联有序列表。/n首先计算无标签行人数据集中第i个数据与其他数据的特征向量欧式距离,如式(2)所示:/n /n其中 和 分别为无标签行人数据集第i个数据与第j个数据的特征向量, 表示 和 的欧式距离。根据其他数据与第i个数据之间的特征向量欧式距离,获得前k个最小距离所对应的数据序号,构成以第i个数据为基准的一级有序列表 如式(3)所示。/n /n然后分别计算以第Dp个数据为基准的有序列表 构建二级有序列表 如式(4)所示。/n /n最后构成第i个数据所对应的级联有序列表Casseti(k,q),如式(5)所示。/n /n其中Casseti(k,q)的元素个数为P,P=k+k×q,k设置为10~20,q取3~8。/n步骤5:根据步骤4可得到级联有序列表Casseti(k,q)和Cassetj(k,q),首先计算列表相似度 如式(6)所示。/n /n其中posi(l)表示无标签行人数据集中第l个数据在Casseti(k,q)中的位置序号,posj(l)表示第l个数据在Cassetj(k,q)中的位置序号;位于级联有序列表位置序号P之后的数据,将不参与列表相似度 的计算。/n然后综合考虑Cassetj(k,q)与无标签数据集第i个数据的列表相似度,以及Casseti(k,q)与无标签数据集第j个数据的列表相似度,从而定义无标签数据集第i个数据与第j个数据之间的相似分数 如式(7)所示。/n /n其中ml∈Cassetj(k,q),rl∈Casseti(k,q);规定 为0,即每个数据自身的相似分数为0。/n最后根据其他数据与第i个数据之间的相似分数,构成以第i个数据为基准的相似分数有序列表Listi,如式(8)所示。/n /n步骤6:对于步骤5得到的相似分数有序列表Listi,计算Listi中前n个序号所对应数据的聚合度Gi(n),如式(9)所示。/n /n其中Zk,Zl∈Listi。根据i和Listi前n个序号,定义待划分序号集合Gather(Gi(n)),如式(10)所示。/nGather(Gi(n))={i,Z1,Z2,…,Zn} (10)/n按式(11)的计算规则,可得到聚合度矩阵 /n /n其中nl取5~10,nh取40~50,以此来模拟身份划分时每个身份的人数不一定相同的情况。最后根据聚合度矩阵 取矩阵元素的最大值,得到聚合度指标Gm,如式(12)所示。/n /n步骤7:对于步骤6得到的聚合度指标Gm,当Gm≥δ时,待划分序号集合Gather(Gm)中所有序号所代表的数据都标注为同一身份,然后将已标注的数据从当前无标签数据集中删除。循环执行步骤4~6,持续进行身份划分,实现数据的自动标注。当Gm<δ时循环终止,未被标注的数据将被直接删除。其中δ为超参数,设置为首次计算获得的聚合度矩阵 均值,用来滤除聚合度较低的数据。/n步骤8:假设步骤7得到的身份标注类别数为In,随机删除训练集中In个身份的数据,并将步骤7所获的自动标注数据补充到训练集中,保持训练集的行人身份总数不变,最终实现训练集的自动更新。/n步骤9:在步骤8对训练集更新的基础上,不断重复步骤2~8,实现行人重识别网络的可持续学习,从而加强行人重识别模型对于实际场景的适应性。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910421379.6/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置