[发明专利]基于权重多样性正则化的行人重识别方法及其应用有效
| 申请号: | 202010790733.5 | 申请日: | 2020-08-07 | 
| 公开(公告)号: | CN111931641B | 公开(公告)日: | 2023-08-22 | 
| 发明(设计)人: | 邓圣衡;王鹏飞;丁长兴;李弘洋;黄家荣;陈柏伶;郭思聪 | 申请(专利权)人: | 华南理工大学 | 
| 主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/44;G06V10/82;G06N3/0464;G06N3/08;G06V20/52 | 
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 | 
| 地址: | 510640 广*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 基于 权重 多样性 正则 行人 识别 方法 及其 应用 | ||
1.一种基于权重多样性正则化的行人重识别方法,其特征在于,包括下述步骤:
构建卷积神经网络,包括Resnet50网络、卷积层以及全连接神经网络,并初始化卷积神经网络参数;
图像预处理,得到卷积神经网络的输入张量;
采用交叉熵损失函数和三元组损失函数的同时采用权重多样性损失函数控制卷积神经网络中卷积层的权重互不相同,完成权重多样性正则化;
三元组损失函数表示为:
交叉熵损失函数表示为:
权重多样性损失函数表示为:
其中,d表示两者之间的距离,P(yi)表示图像样本的真实分布,表示卷积神经网络输出样本的预测分布,n表示卷积层个数,wi表示每一个卷积层的权重,xi表示第i类图像特征,xj表示第j类图像特征,xa表示第a类图像特征;
卷积神经网络训练,提取图像中行人不同的局部特征,对每一个行人的局部特征级联成为卷积神经网络输出的特征向量,将提取到的所有行人特征向量进行距离度量,完成行人重识别;
所述卷积神经网络训练的具体步骤包括:
卷积神经网络的卷积层输出行人图像局部特征向量,将行人图像局部特征向量级联得到输出的特征向量,将所有行人的输出特征向量计算三元组损失值,加和取平均值得到第一损失值L1;
卷积神经网络的全连接神经网络输出ID预测值,对多个ID预测值分别计算交叉熵损失值,加和取平均得到第二损失值L2;
卷积层输出各自的权重信息,对多个权重信息计算权重多样性损失值,加和取平均得到第三损失值L3;
计算总损失值L:L=L1+L2+L3;
采用adam优化器进行优化,采用梯度下降的方式对损失值求导,更新网络参数。
2.根据权利要求1所述的基于权重多样性正则化的行人重识别方法,其特征在于,所述卷积神经网络包括:Resnet50网络、6个卷积层以及6个全连接神经网络,将Resnet50网络移除下采样。
3.根据权利要求1所述的基于权重多样性正则化的行人重识别方法,其特征在于,所述图像预处理具体步骤包括:
将图像随机裁剪并进行设定概率的水平翻转,将随机翻转后的图像进行归一化处理得到三维张量,随机将三维张量中的部分区域设置为图像均值,然后进行随机色彩抖动处理,得到卷积神经网络的输入张量。
4.根据权利要求1所述的基于权重多样性正则化的行人重识别方法,其特征在于,所述将提取到的所有行人特征向量进行距离度量,具体步骤包括:
将行人特征向量与公开数据集中的行人特征向量进行余弦距离计算,对计算得到的余弦距离进行排序,余弦距离最近的特征向量所对应的行人图像ID即为匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010790733.5/1.html,转载请声明来源钻瓜专利网。





