[发明专利]一种行人搜索方法、系统、设备及介质在审
申请号: | 202111394351.1 | 申请日: | 2021-11-22 |
公开(公告)号: | CN113989750A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 杨华;刘创;郑世宝 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V20/40;G06V40/10;G06V10/774;G06V10/74;G06K9/62 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 行人 搜索 方法 系统 设备 介质 | ||
本发明公开了一种行人搜索方法、系统、设备及介质。所述方法包括:把行人搜索中的行人重识别子任务作为主导子任务,并构建行人重识别任务的数据集;基于构建的所述数据集,预训练行人重识别模型;将预训练好的所述行人重识别模型的权重迁移到行人搜索模型,并对所述行人搜索模型进行端到端的重新训练;其中,预训练好的所述行人重识别模型和所述行人搜索模型具有相同的主干网络结构。本发明在一定程度上提高了行人搜索的准确度,同时也具有较强的鲁棒性。
技术领域
本发明涉及计算机视觉技术领域,特别涉及一种行人搜索方法及系统、计算机设备、计算机可读存储介质。
背景技术
行人搜索可以定义为在无重叠的视频监控网络中,对于摄像头中给定的某个行人,从大规模的监控视频数据库中搜索出该目标行人。行人搜索通常包含行人检测和行人重识别两个过程。行人搜索可以在大量监控网络产生的视频中快速定位感兴趣的行人目标,广泛适用于安防以及公共场所寻人等场景,是智能视频监控的重要技术,在计算机视觉领域得到了广泛的关注。
目前通常采用基于深度学习的、集成行人检测和行人重识别的端到端的行人搜索技术来对目标行人进行搜索。然而集成行人检测与行人重识别的端到端行人搜索模型虽然具有参数量少、运行速度快的优点,但是却面临着提取到的行人特征区分度不足的缺点,这主要是由于集成了行人检测子任务导致行人重识别子任务训练不充分不高效造成的。
因此,如何能够在集成行人检测和行人重识别的端到端行人搜索技术中提高行人特征提取的区分度,成为目前亟待解决的问题之一。
发明内容
针对现有技术的不足,本发明提供一种行人搜索方法、系统、设备及介质,以在不同的场景中准确地搜索出目标。
本发明的第一方面,提供一种行人搜索的方法,包括:
把行人搜索中的行人重识别子任务作为主导子任务,并构建行人重识别任务的数据集;
基于构建的所述数据集,预训练行人重识别模型;
将预训练好的所述行人重识别模型的权重迁移到行人搜索模型,并对所述行人搜索模型进行端到端的重新训练;
其中,预训练好的所述行人重识别模型和所述行人搜索模型具有相同的主干网络结构。
可选的,构建行人重识别主导子任务常用形式的数据集包括:
根据行人搜索数据集的行人坐标标注将对应的行人从视频帧中剪裁下来;
根据行人搜索数据集的行人身份标注对剪裁下来的对应行人进行身份信息的标注。
可选的,基于构建的行人重识别数据集训练行人重识别模型,其中,进行预训练的行人重识别模型应当和行人搜索模型具有相同的主干网络架构。进行行人重识别模型的预训练时可以采取各种有效的行人重识别训练方法以提高预训练模型的准确度。
可选的,将预训练好的行人重识别模型的权重迁移到行人搜索模型并对行人搜索模型进行端到端的重新训练包括:
用预训练的行人重识别模型的主干网络权重对行人搜索模型的主干网络权重进行初始化;
对初始化完毕的行人搜索模型进行端到端的训练。
可选地,所述方法还宝包括:
使用训练完毕的所述行人搜索模型对待搜索的行人目标进行特征提取,得到目标行人特征;
使用训练完毕的所述行人搜索模型检测候选视频库中的行人,同时提取对应的行人特征,得到候选行人特征;
根据所述目标行人特征和检测到的所受候选行人特征进行相似度或者距离计算,得到目标行人在候选视频库上的搜索排序结果。
本发明的第二方面,提供一种行人搜索系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111394351.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:环境物表消毒生物消毒剂
- 下一篇:一种非直接接触式超声型核酸提取仪