[发明专利]目标对象识别方法、装置、计算设备及介质在审
申请号: | 202010907053.7 | 申请日: | 2020-09-01 |
公开(公告)号: | CN113761998A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 刘鑫辰;刘武;梅涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 刘丽丽 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 对象 识别 方法 装置 计算 设备 介质 | ||
本公开提供了一种目标对象识别方法,该方法包括获取多个待识别图像,多个待识别图像包括至少一个目标对象的步态信息;以及利用经训练的深度学习模型,识别多个待识别图像,以得到针对至少一个目标对象的识别结果;其中,通过以下操作训练深度学习模型:利用源域步态轮廓序列,训练深度学习模型,得到第一学习模型;以及利用目标域步态轮廓序列训练第一学习模型,得到经训练的深度学习模型。本公开还提供了一种目标对象识别装置、计算设备和介质。
技术领域
本公开涉及图像识别领域,更具体地,涉及一种目标对象识别方法、装置、计算设备及介质。
背景技术
行人重识别技术是指根据目标行人的图像或视频片段,在拍摄区域不重叠的多个摄像头所组成的监控网络中搜索与该目标行人身份相同的行人。步态识别是行人重识别的一种特例。步态是一种极具潜质的生物特征,它反映了行人的行走模式。由于存在运动差异和体型差异,每个人的步态都是唯一的,利用步态可以唯一识别视频中的目标行人。近些年,深度学习在图像、视频、语音等方面取得了突破性的进展,并展现了强大的特征学习能力。相关技术利用深度学习技术进行步态识别,相对于传统的步态识别方法识别性能得到了显著提高。
尽管深度学习对步态识别有了很大的改进,但相关技术只考虑在单个步态数据集上进行模型的训练和测试,而忽略了跨域(交叉数据集)的情况。由于跨域会存在域间类别数不对等和数据风格不一致等问题,所以将一个步态数据集上训练的模型直接应用于其他步态数据集进行测试,通常会获得较差的结果。
发明内容
有鉴于此,本公开提供了一种目标对象识别方法、装置、计算设备及介质。
本公开的一个方面提供了一种目标对象识别方法,包括:获取多个待识别图像,所述多个待识别图像包括至少一个目标对象的步态信息;以及利用经训练的深度学习模型,识别所述多个待识别图像,以得到针对所述至少一个目标对象的识别结果;其中,通过以下操作训练深度学习模型:利用源域步态轮廓序列,训练所述深度学习模型,得到第一学习模型;以及利用目标域步态轮廓序列训练所述第一学习模型,得到所述经训练的深度学习模型。
根据本公开的实施例,所述深度学习模型包括深度卷积神经网络模块、池化模块和水平金字塔映射模块;所述利用源域步态轮廓序列,训练深度学习模型,包括:初始化所述深度学习模型的参数,并重复执行以下操作第一预设次数:获取源域步态轮廓序列;利用所述深度卷积神经网络模块,从所述源域步态轮廓序列中提取多个帧级特征;利用所述池化模块,根据所述多个帧级特征,确定序列级特征;利用所述水平金字塔映射模块,根据所述序列级特征,生成目标序列特征;以及根据所述目标序列特征,调整所述深度学习模型的参数。
根据本公开的实施例,所述初始化所述深度学习模型的参数包括:将所述深度学习模型的参数设置为随机数。
根据本公开的实施例,所述根据所述目标序列特征,调整所述深度学习模型的参数包括:根据以下公式计算第一损失函数值,
其中,所述L为第一损失函数值,所述N是源域步态轮廓序列中的源域步态图像数,所述是所述源域步态轮廓序列中的第i个源域步态图像,所述和所述分别是相对于所述第i个源域步态图像的正样本和负样本,所述m是裕度参数,符号“|| ||”表示计算该符号内的两向量之间的距离,符号“[ ]+”表示该符号内的运算结果取正数;以及根据所述损失函数调整所述深度学习模型的参数。
根据本公开的实施例,所述利用目标域步态轮廓序列训练所述第一学习模型包括重复执行预设轮次的模型更新操作;其中,所述预设轮次的模型更新操作中的每轮模型更新操作包括:重复执行以下操作第二预设次数:利用所述第一学习模型,从所述目标域步态轮廓序列中提取多个特征样本;确定所述多个特征样本中每个特征样本的信息熵;根据所述信息熵,从所述多个特征样本中确定预设比例的特征样本作为锚样本;确定所述锚样本的邻域;根据所述锚样本的邻域,计算第二损失函数值;以及根据所述损失函数值,调整所述深度学习模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010907053.7/2.html,转载请声明来源钻瓜专利网。