[发明专利]行人检测和再识别的方法及装置在审
申请号: | 201710330307.1 | 申请日: | 2017-05-11 |
公开(公告)号: | CN106971178A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 张弛 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 北京市磐华律师事务所11336 | 代理人: | 高伟,刘爱平 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 检测 识别 方法 装置 | ||
技术领域
本发明涉及图像识别领域,更具体地涉及一种行人检测和再识别的方法及装置。
背景技术
行人检测可以应用于智能驾驶、辅助驾驶和智能监控等相关领域,主要用于检测图像或视频中是否存在行人。行人再识别(re-identification,ReID)也称为行人重识别,可以应用于安防领域、刑侦领域等相关领域,主要用于在一组行人的图像中找到和目标最像的一张图像。在现有的方法中,往往将行人检测和ReID视为两个相互独立的环节。在行人检测环节中,针对每一帧图像找到行人,并通过边框把它们的位置和大小表示出来。然后在ReID环节比较这些行人和目标的相似度,从而达到ReID的目的。然而,由于在以上两个环节中的每一个环节都可能引入额外的误差,因此通过上述独立的两个环节之后容易造成误差的传播扩大,从而导致计算精度低。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种行人检测和再识别的方法及装置,能够在行人检测的同时确定用于ReID的特征信息,避免引入额外的误差,从而保证计算的精度。
根据本发明的第一方面,提供了一种行人检测和再识别的方法,包括:
提取原始图像的特征张量;
根据所述特征张量,确定至少一个子区域;
计算与所述至少一个子区域一一对应的至少一个向量特征;
基于所述至少一个向量特征,确定所述原始图像中行人的位置以及提取用于再识别的待识别行人特征信息。
示例性地,所述根据所述特征张量,确定至少一个子区域,包括:
根据所述特征张量,构建多个超像素点,每个超像素点表示一个C维向量;
根据所述多个超像素点,确定与所述多个超像素点一一对应的多个区域;
根据所述多个区域确定所述至少一个子区域。
示例性地,所述根据所述多个区域确定所述至少一个子区域,包括:采用非极大值抑制NMS算法,基于所述多个区域确定多个矩形区域;将所述多个矩形区域对应的特征进行综合,得到所述至少一个子区域。
示例性地,所述计算与所述至少一个子区域一一对应的至少一个向量特征,包括:
对于所述至少一个子区域中的每个子区域:
将所述每个子区域中的所有的超像素点对应的向量中各个频道取最大值或平均值,得到与所述每个子区域对应的向量特征。
示例性地,所述基于所述至少一个向量特征,确定所述原始图像中行人的位置以及提取用于再识别的待识别行人特征信息,包括:
基于所述至少一个向量特征,确定所述原始图像中行人的位置,其中,所述位置表示为所述行人在所述原始图像中的坐标;以及
基于所述至少一个向量特征,提取用于再识别的所述待识别行人特征信息。
示例性地,还包括:基于所述至少一个向量特征,判断所述至少一个子区域中的物体是否为行人。
示例性地,还包括:将所述用于再识别的待识别行人特征信息与目标行人特征信息进行比对,以判断所述用于再识别的待识别行人特征信息对应的行人与所述目标行人是否为同一人。
示例性地,所述目标行人特征信息通过以下步骤获得:
提取目标行人图像的特征张量;
根据所述目标行人图像的特征张量,确定目标行人区域;
计算与所述目标行人区域对应的至少一个目标向量特征,基于所述至少一个目标向量特征,获得所述目标行人特征信息。
根据本发明的第二方面,提供了一种行人检测和再识别的装置,包括:
提取模块,用于提取原始图像的特征张量;
第一确定模块,用于根据所述特征张量,确定至少一个子区域;
计算模块,用于计算与所述至少一个子区域一一对应的至少一个向量特征;
第二确定模块,用于基于所述至少一个向量特征,确定所述原始图像中行人的位置以及提取用于再识别的待识别行人特征信息。
示例性地,所述第一确定模块,包括:
构建子模块,用于根据所述特征张量,构建多个超像素点,每个超像素点表示一个C维向量;
第一确定子模块,用于根据所述多个超像素点,确定与所述多个超像素点一一对应的多个区域;
第二确定子模块,用于根据所述多个区域确定所述至少一个子区域。
示例性地,所述第二确定子模块,用于:采用非极大值抑制NMS算法,基于所述多个区域确定多个矩形区域;将所述多个矩形区域对应的特征进行综合,得到所述至少一个子区域。
示例性地,所述计算模块,用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710330307.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种驾驶员疲劳驾驶检测方法
- 下一篇:一种数据匹配方法及系统