[发明专利]基于深度学习联合优化的行人重识别方法在审
| 申请号: | 201810932825.5 | 申请日: | 2018-08-15 |
| 公开(公告)号: | CN109102025A | 公开(公告)日: | 2018-12-28 |
| 发明(设计)人: | 程建;王艳旗;苏炎洲;林莉;汪雯 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 邹敏菲 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络结构 验证 两路 卷积神经网络 分类网络 联合优化 损失函数 构建 联合 特征融合模块 分类模型 模型参数 数量均衡 特征增强 网络结构 样本输入 网络 多层级 多尺度 数据集 学习 优化 样本 送入 采集 筛选 分类 检测 | ||
本发明公开了一种基于深度学习联合优化的行人重识别方法,步骤为:步骤1、采集筛选数量均衡的正负行人样本对,构建数据集;步骤2、构建深度学习的Siamese神经网络结构模型,包括两路前端卷积神经网络和多层级特征融合模块,将正负行人样本输入模型,提取得到两路不同的行人的Hyper特征;步骤3、将两路不同行人的Hyper特征送入分类网络和验证网络,联合分类网络和验证网络,联合分类损失函数和验证损失函数,优化神经网络结构模型参数。该方法联合采用深度卷积神经网络和HyperNet网络,提取多尺度的特征增强对行人目标的检测能力,联合验证模型和分类模型优化网络结构,得到性能优越的行人重识别神经网络结构模型。
技术领域
本发明属于计算机视觉中的行人重识别技术领域,具体涉及一种基于深度学习联合优化的行人重识别方法。
背景技术
行人重识别是计算机视觉和模式识别领域中的重要课题之一,其中行人重识别是指在多摄像头内检索给定行人目标,并将检索结果进行关联匹配,用以快速、准确地发现目标行人在多摄像头下的活动画面和轨迹。由于其在智能视频监控、多目标追踪等领域具有重要的意义,近年来受到越来越多相关领域科研工作人员及政府、公安部门广泛的关注。
行人重识别主要研究使用视觉特征来匹配行人目标。但由于同一行人在不同摄像头视域之间通常存在非常大的视角、照明条件和摄像头设置的变化,这些都给基于外观的跨视域多摄像下的行人图像匹配带来了巨大的挑战。针对这些问题,行人重识别的研究工作主要分为基于表征学习的行人重识别方法、基于度量学习行人重识别方法以及基于深度学习的行人重识别方法。
近年来,当前最佳的行人重识别方法都是基于深度卷积神经网络的,卷积神经网络能够学习到优于传统手工特征的具有区分性的特征,如果采用HyperNet网络能够端到端地从原始的场景图像中得到Hyper特征。另外,目前基于深度学习的行人重识别网络结构主要分为验证模型和分类模型,两种模型在训练过程中的输入数据、特征提取和损失函数等都有很大不同,但各有各的优缺点。2017年,Zheng融合了两种神经网络模型提取更具有鲁棒性的行人特征,但是方法仍存在不足:图像中目标遮挡导致的部分特征丢失,不同视角、光照条件等导致同一目标的特征差异,以及不同目标衣服颜色的近似、特征近似都会导致区分度下降,在行人重识别中的性能下降。基于上述三个问题,主要的解决方案可以聚焦在两个关键点,一是提取良好的特征,二是选择合适的距离度量函数。本发明提出了提取多尺度的、目标检测能力强的Hyper特征和一种基于深度学习的Siamese神经网络结构模型,结合样本对类别信息和相似度联合优化网路模型参数。
经过对现有技术的检索,发现已有的行人重识别方法没有一种采用深度卷积神经网络和HyperNet网络结合,并联合验证模型和分类模型以及多种损失函数的系统的识别方法。深度卷积神经网络相较于传统方法特征学习能力更佳,而HyperNet网络能够获取多尺度的特征,联合两种损失函数能够得到更好的优化网络模型参数,这些都会在行人重识别的应用研究中产生优越的性能。
发明内容
本发明的目的在于:解决现有的行人重识别方法特征提取存在丢失和差异,以及特征区分度下降的不足,导致行人重识别中的性能下降的问题,提出基于深度学习联合优化的行人重识别方法,联合采用深度卷积神经网络和HyperNet网络,提取多尺度的特征,增强对行人目标的检测能力,联合验证模型和分类模型、联合多损失函数优化网络结构,得到性能优越的行人重识别神经网络结构模型。
本发明采用的技术方案如下:
基于深度学习联合优化的行人重识别方法,方法步骤如下:
步骤1、采集筛选数量均衡的正负行人样本对,构建数据集;
步骤2、构建深度学习的Siamese神经网络结构模型,包括两路由5个卷积模块构成的前端卷积神经网络和多层级特征融合模块,将数据集中的正负行人样本输入模型,提取得到两路不同的行人的Hyper特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810932825.5/2.html,转载请声明来源钻瓜专利网。





