[发明专利]基于聚类引导和成对度量三元组损失的行人重识别方法在审
| 申请号: | 202110481365.0 | 申请日: | 2021-04-30 | 
| 公开(公告)号: | CN113158955A | 公开(公告)日: | 2021-07-23 | 
| 发明(设计)人: | 曾威瑜;曹九稳;王天磊;王建中 | 申请(专利权)人: | 杭州电子科技大学 | 
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 | 
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 | 
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 基于 引导 成对 度量 三元 损失 行人 识别 方法 | ||
1.基于聚类引导和成对度量三元组损失的行人重识别方法,其特征在于包括如下步骤:
步骤1、基于深度学习网络输出的特征和其对应的标签,获取相似度矩阵;
步骤2、计算成对度量中的余弦相似度度量难样本采样损失;
步骤3、计算成对度量中的欧式相似度度量难样本采样损失;
步骤4、计算聚类引导修正项,并融合所有损失得到聚类引导和成对度量三元组损失;
步骤5、聚类引导和成对度量三元组损失与基于表征学习的交叉熵损失结合得到最终损失,加入网络参数训练更新。
2.根据权利要求1所述的基于聚类引导和成对度量三元组损失的行人重识别方法,其特征在于所述的步骤1具体包括以下几个步骤:
所述的步骤1具体包括以下几个步骤:
1-1、获取深度学习网络输出的特征张量其中b为训练批次,c为张量维数,特征张量X对应的特征标签向量为
1-2、将特征标签向量P张成b×b的矩阵,从而得到矩阵形式的标签l1:
l1=P.view(b,1).expand([b,b]) (1)
其中.view(b,1)代表将向量张成2维矩阵,第二维目前并不保存元素,而.expand([b,b])表示将第一维的数据逐列复制到以b×b为大小的矩阵范围内,不同行数表示不同样本,则相同样本的不同维数之间保存的标签值是一样的;
1-3、将特征标签向量P张成b×b的矩阵,再经过矩阵转置得到矩阵形式的标签l2:
l2=P.view(b,1).expand([b,b]).t (2)
其中.t为矩阵转置操作;
1-4、对l1和l2取相等判断式,如果相应位置标签相等将被保留,最终得到标签对角矩阵sim:
sim=(l1==l2) (3)
其中==为判断值是否相等,不相等则值被去除,相等则原值保留。
3.根据权利要求2所述的一种基于聚类引导和成对度量三元组损失的行人重识别方法,其特征在于得到的相似度量矩阵将应用于之后的难样本采样,所述的步骤2通过计算余弦度量矩阵找出最难样本,具体实现流程如下:
2-1、对特征张量X按列进行数据正则化;
2-2、计算余弦距离度量下的余弦相似度矩阵distc:
distc=clamp(X·XT,-1-ζ,1+ζ) (4)
其中ζ为一个极小的常数,clamp为数据截断操作,将余弦距离矩阵中的值截断在[-1-ζ,1+ζ]的区间内,从而剔除矩阵运算中分母出现异常值导致计算无法进行的情况;
2-3、对余弦相似度矩阵的元素排序,获取余弦相似度矩阵中所有样本对;将正样本对中距离最大、相似度最低的难样本提取出来,得到难正样本对距离hp;将负样本对中距离最小、相似度最高的难样本提取出来,得到负样本对距离hn;按照难正样本对距离hp构建对应的正样本对标签矩阵y,所有对应的正样本对的位置标签值都和负样本对不同,以此区分正负样本对;
2-4、计算成对度量中的余弦相似度度量难样本采样损失Lc:
Lc=max(0,-y·(hn-hp)+m) (5)
其中max为最大值函数,返回两值之中的最大值,用于限制损失Lc出现小于0的情况,m为损失间隔,为一个预设的常数;三元组形式损失旨在最大化难负样本对距离,最小化难正样本对距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110481365.0/1.html,转载请声明来源钻瓜专利网。





