[发明专利]视频图像中的行人重识别方法、装置、存储介质及处理器在审
| 申请号: | 201710982219.X | 申请日: | 2017-10-20 |
| 公开(公告)号: | CN107844753A | 公开(公告)日: | 2018-03-27 |
| 发明(设计)人: | 王志鹏;周文明 | 申请(专利权)人: | 珠海习悦信息技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 北京挺立专利事务所(普通合伙)11265 | 代理人: | 倪钜芳 |
| 地址: | 519080 广东省珠海市高新区唐*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 图像 中的 行人 识别 方法 装置 存储 介质 处理器 | ||
技术领域
本发明涉及视频处理领域,具体而言,涉及一种视频图像中的行人重识别方法、装置、存储介质及处理器。
背景技术
行人重识别,即给定目标行人的检索图像(probe),在多个无视野重叠的摄像机视频图像中(gallery)检索与目标行人相匹配的图像,从而确定目标行人出现过的位置及监控画面。行人重识别对于人物检索、嫌疑人搜寻等多种应用起着至关重要的作用。然而,由于不同摄像头的架设角度、背景环境、光线条件、分辨率、行人姿态动作等区别变化,行人重识别问题存在诸多难点。
现有的技术中,常将行人重识别作为两个问题分别进行解决,即特征表示与度量学习,前者在于学习一种具有光线、角度、环境等多种条件不变性的特征,后者旨在基于行人特征向量学习一种强区分性的距离度量函数。随着深度学习的流行,有研究通过构建卷积神经网络,同时进行特征表示与度量学习,实现端对端的行人重识别。如,专利CN106971178A提出了一种行人检测和再识别的方法及装置,利用卷积神经网络进行行人检测之后对检测到的行人图像区域提取特征张量,将目标行人特征张量与待识别行人特征张量进行直接对比,得到匹配结果。专利CN106778464A提出了一种基于深度学习的行人重识别方法和装置,基于深度学习网络模型提取目标行人图像与参考行人图像的特征,计算特征相似度并进行排序,将相似度最高的参考行人图像判断为目标行人。
考虑到人类视觉系统在进行辨别时,首先通过全局特征进行区分,如行人的服装总体颜色、外形轮廓特征等,然后进一步对全局相似的图像进行局部化细节特征的区分,属于从粗糙到精细的多个阶段化过程。然而,现有行人重识别技术中的匹配过程仅为单个阶段。在现实应用中,需要检索的行人监控图像视频数量常常十分庞大,现有技术通过将目标行人图像与待检索的行人图像进行逐一比对,一次性得到识别匹配结果,不仅所需的计算量与计算时间随着检索图像的增加而骤增,同时识别精度也会随着干扰图像增多而大大降低,难以在效率与精度之间获得平衡。综上,现有技术中的视频图像中的行人重识别方式存在识别效率低、精度差的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种视频图像中的行人重识别方法、装置、存储介质及处理器,以至少解决现有技术中的视频图像行人重识别方式存在的识别效率低、精度差的技术问题。
根据本发明实施例的一个方面,提供了一种视频图像中的行人重识别方法,该方法包括:根据预设行人重识别数据集训练第一卷积神经网络模型,得到第二卷积神经网络模型,其中,上述第二卷积神经网络模型为达到收敛状态的上述第一卷积神经网络模型,上述第二卷积神经网络模型包括全局特征提取分支和局部特征提取分支;对上述第二卷积神经网络模型中的上述全局特征提取分支添加哈希二值化层,得到第三卷积神经网络模型;根据上述预设行人重识别数据集训练上述第三卷积神经网络模型,得到第四卷积神经网络模型,其中,上述第四卷积神经网络模型为达到收敛状态的上述第三卷积神经网络模型;输入一张目标行人图像和多张待识别行人图像至上述第四卷积神经网络模型,得到一个目标全局二值化特征向量、一个目标局部特征向量和多个待识别全局二值化特征向量;计算上述一个目标全局二值化特征向量和上述多个待识别全局二值化特征向量之间的第一空间向量距离,得到多张初步识别行人图像,其中,上述多张初步识别行人图像中的每张上述初步识别行人图像与上述目标行人图像对应的上述第一空间向量距离均小于预设第一空间向量距离阈值;将上述多张初步识别行人图像输入至上述第四卷积神经网络模型,得到多个初步识别局部特征向量;计算上述目标局部特征向量和上述多个初步识别局部特征向量之间的第二空间向量距离,得到与上述目标行人图像所匹配的行人重识别结果。
进一步地,在根据预设行人重识别数据集训练第一卷积神经网络模型之前,上述方法还包括:获取多个摄像头拍摄到的行人视频图像;截取上述行人视频图像中的每帧图片中的行人区域,并对上述行人区域添加身份标签;根据上述行人区域和上述身份标签得到上述预设行人重识别数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海习悦信息技术有限公司,未经珠海习悦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710982219.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





