[发明专利]基于神经架构搜索的行人重识别模型构建方法及装置在审
| 申请号: | 201910964255.2 | 申请日: | 2019-10-11 |
| 公开(公告)号: | CN110852168A | 公开(公告)日: | 2020-02-28 |
| 发明(设计)人: | 彭进业;曹蕊;张世周;王鹏;张艳宁;樊萍;赵万青;张二磊;李斌 | 申请(专利权)人: | 西北大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 黄小梧 |
| 地址: | 710069 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 神经 架构 搜索 行人 识别 模型 构建 方法 装置 | ||
本发明公开了一种基于神经架构搜索的行人重识别模型构建方法及装置,首先对输入的图像数据集进行随机采样和分组,并设置以三元组损失函数为辅助的目标函数来指导网络架构的搜索;然后,利用搜索到的最佳网络架构单元重复堆叠一个大型网络,并对该网络进行重训练,得到行人重识别模型,本发明提供的方法不仅仅考虑了分类精度,还利用了不同样本之间的距离,以最大化不同行人之间的特征识别能力,因此以此损失函数指导架构搜索的方向能够学习得到更适用于行人重识别并且性能表现更好网络架构,从而提高了行人重识别的准确率。
技术领域
本发明涉及行人重识别方法,具体涉及一种基于神经架构搜索的行人重识别模型构建方法及装置。
背景技术
行人重识别也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。一般是给定一个监控行人图像,检索跨设备下的该行人图像。
目前主要有两种行人重识别研究方法:一种是表征学习,另一种是度量学习。基于表征学习的方法是为了获得强大且具有辨别力的行人特征。基于度量学习的方法通过设计合适的距离度量函数来学习图像对之间的相似性,旨在使相同身份图像的距离尽可能小,并且不同识别图像的距离尽可能大。上述这些方法大多都是基于经典的在外部数据上预先训练好的分类神经网络架构(如着名的ResNet50,Inception和DenseNet)作为骨干网络,然后再使用目标数据对改进的网络进行微调。这样的做法导致网络架构固化且依赖于外部数据的预训练。此外,还有一些是人类专家为行人重识别任务专门设计网络的方法,但随着网络需求增加,手动网络设计变得更加困难,且往往无法实现最佳设置。
现有技术还提出了一种使用神经架构搜索技术作为解决上述问题的工具,神经架构搜索技术一般包括定义搜索空间,然后通过搜索策略找出候选网络结构,神经架构搜索技术提出基于单元cell的搜索,即只对cell结构进行结构搜索,总体网络由这些cell进行重叠拼接而成。
但是大多数神经架构搜索方法都是处理分类任务的,行人重识别的训练行人类别与测试行人类别没有交叉且性能评价指标类似于排序结果而并非是分类精度,这与神经架构搜索在分类上的优化目标不一致,并不能直接扩展到行人重识别任务,导致识别准确率不高,识别效果不佳。
发明内容
本发明的目的在于提供一种基于神经架构搜索的行人重识别模型构建方法及装置,用以解决现有技术中的神经架构搜索方法无法直接应用扩展到行人重识别任务上,导致行人重识别效果不好的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于神经架构搜索的行人重识别模型构建方法,按照以下步骤执行:
步骤1、获得行人图像数据集,所述的行人图像数据集包括训练数据集以及验证数据集;
所述的训练数据集以及验证数据集均包括多组数据,其中每组数据包括多个类别数据,每个类别数据包括多幅行人图像;
对于每幅行人图像,该行人图像本身为原样本,与原样本属于同一类别数据的其他所有行人图像均为正样本,每组数据中除原样本以及正样本以外的其他所有行人图像均为负样本;
获得行人图像数据集中每幅行人图像对应的类别,获得标签集;
步骤2、将所述的训练数据集以及验证数据集作为输入,将所述的标签集作为输出,对初始网络中进行搜索,获得最优卷积单元;
所述的初始网络包括多个卷积单元;
在搜索时采用式I的损失函数L:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910964255.2/2.html,转载请声明来源钻瓜专利网。





