[发明专利]一种高效率的无监督行人重识别方法和装置在审
申请号: | 202110661203.5 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113536928A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 丁贵广;沈乐琦;何涛 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高效率 监督 行人 识别 方法 装置 | ||
1.一种无监督行人重识别方法,其特征在于,包括以下步骤:
获取摄像网络采集的行人图片;
对所述行人图片进行预处理,根据预处理后的所述行人图片生成训练图片集;
对所述训练图片集中的训练图片进行分组以得多个随机组成小批次的数据,将每个随机组成的小批次数据中的训练图片分别输入到预先训练的权重滑动平均模型,以得到所述训练图片对应的图片特征;
计算所述图片特征中两两图片特征之间的相似度,根据所述两两图片特征之间的相似度生成相似度矩阵;
根据所述相似度矩阵,使用关系蒸馏的方式计算损失函数,根据所述损失函数以权重滑动平均的方法更新模型,得到高精度复杂模型;
由所述高精度复杂模型,进一步知识蒸馏得到高精度轻量模型;
根据最终得到的高精度轻量模型提取识别图片样本的特征,进行行人检索。
2.如权利要求1所述的方法,其特征在于,获取摄像网络采集的行人图片,包括:
在多个时间段内,不同的光线条件下,采集监控视频,并从所述监控视频中检测出所述行人图片。
3.如权利要求2所述的方法,其特征在于,对所述行人图片进行预处理,包括:
对所述行人图片数据进行数据增强处理和归一化处理;
对所述行人图片数据进行数据增强处理,包括随机水平翻转图片操作、随机图片剪裁操作、随机图片色彩扰动操作和图片上下左右填充操作中的一种或者多种。
4.如权利要求2或3所述的方法,其特征在于,还包括:
训练基础模型和权重滑动平均模型,所述训练基础模型和所述权重滑动平均模型具有相同的网络结构,其中,基础模型的权重参数为θ,权重滑动平均模型的参数为θ',权重滑动平均的参数为α,其中α∈[0,1],在每一批次输入给模型后,所述基础模型正常更新权重,所述权重滑动平均模型按照θ'←αθ'+(1-α)θ更新权重。
5.如权利要求1所述的方法,其特征在于,根据下述公式计算损失函数:
其中,基础模型得到的相似度矩阵为Mbase,权重滑动平均模型得到的相似度矩阵记为Maverage。
6.一种无监督行人重识别装置,其特征在于,包括:
第一获取模块,用于获取摄像网络采集的行人图片;
处理模块,用于对所述行人图片进行预处理,根据预处理后的所述行人图片生成训练图片集;
第二获取模块,用于对所述训练图片集中的训练图片进行分组以得多个随机组成小批次的数据,将每个随机组成小批次的数据中的训练图片分别输入到预先训练的权重滑动平均模型,以得到所述训练图片对应的图片特征;
生成模块,用于计算所述图片特征中两两图片特征之间的相似度,根据所述两两图片特征之间的相似度生成相似度矩阵;
第一更新模块,用于根据所述相似度矩阵,使用关系蒸馏的方式计算损失函数,根据所述损失函数以权重滑动平均的方法更新模型,得到高精度复杂模型;
第二更新模块,由所述高精度复杂模型,进一步知识蒸馏得到高精度轻量模型;
识别模块,根据最终得到的高精度轻量模型提取识别图片样本的特征,进行行人检索。
7.如权利要求6所述的方法,其特征在于,所述第一获取模块,具体用于:
在多个时间段内,不同的光线条件下,采集监控视频,并从所述监控视频中检测出所述行人图片。
8.如权利要求7所述的方法,其特征在于,所述处理模块具体用于:
对所述行人图片数据进行数据增强处理和归一化处理;
对所述行人图片数据进行数据增强处理,包括随机水平翻转图片操作、随机图片剪裁操作、随机图片色彩扰动操作和图片上下左右填充操作中的一种或者多种。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的基于摄像头关系的自监督行人重识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110661203.5/1.html,转载请声明来源钻瓜专利网。