[发明专利]一种基于生成网络的行人重识别数据生成和扩充方法有效
申请号: | 201710857752.3 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107679465B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 杨华;陈琳;高志勇 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 31317 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人: | 徐红银;刘翠<国际申请>=<国际公布>= |
地址: | 200240*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据生成 数据集 样本 网络生成 背景变换 背景干扰 欧氏距离 视频预测 数据扩充 特征提取 提取特征 行人识别 行人数据 性能损失 网络 鲁棒性 视频帧 送入 多样性 并用 对抗 评估 联合 | ||
本发明提供了一种基于生成网络的行人重识别数据生成和扩充方法,步骤为:利用视频预测网络生成新的行人视频帧样本。利用深度生成对抗网络进行端到端的行人背景变换数据生成。利用不同的数据生成方法进行行人数据集的广度和丰富性的扩充。将扩充的数据集送入特征提取网络中提取特征并用欧氏距离评估性能。本方法同时考虑了行人的类内和类间数据扩充,联合利用了不同的生成网络生成更多更丰富的样本,扩充的数据集具有很好的多样性和鲁棒性,能更好的解决与适应由于样本数量不足和背景干扰带来的性能损失,具有普遍的适用性,扩充的数据集在下一步的行人识别中能发挥更好的性能及效率。
技术领域
本发明属于计算机视觉技术领域,具体为一种基于生成网络的行人重识别数据生成和扩充方法,尤其是涉及一种适合于行人重识别中提升识别性能的数据生成和扩充方法。
背景技术
行人重识别是智能视频监控中的一项关键任务,是近年来计算机视觉领域中一直备受关注的研究热点,适用于安防以及公共场所寻人等技术领域。行人重识别可定义为:在无重叠的视频监控网络中,对于摄像头中给定的某个行人,判断其是否出现在其他摄像头中的过程。它是一种自动的目标识别技术,能在监控网络中快速定位到感兴趣的人体目标,是智能视频监控和人体行为分析等应用中的重要步骤。
现有的深度行人重识别网络,基于训练数据与待测试数据是独立同分布的思想,用当前的训练数据来对将来的数据进行估计与模拟。因此不充分的训练数据集会给网络性能带来很大的影响,使得训练时准确率较高,测试时表现很差。这种现象被称为过拟合。由于现有行人重识别数据集普遍过小,不足以满足深度网络训练要求,往往更容易导致过拟合从而带来性能损失。现有的方法分为三种,一是提出收集更多的标注数据从而对数据集进行扩充(参见J.Ponce,T.L.Berg,M.Everingham,D.A.Forsyth,M.Hebert,S.Lazebnik,M.Marszalek,C.Schmid,B.C.Russell,and A.Torralba.2006.Dataset Issues in ObjectRecognition.Springer Berlin Heidelberg.29-48pages),但这种方法代价过大,并且标注工作的可靠性也不够高;二是加入非标注数据,进行无监督学习从而提升性能(参见Peixi Peng,Tao Xiang,Yaowei Wang,Massimiliano Pontil,Shaogang Gong,TiejunHuang,and Yonghong Tian.2016.Unsupervised Cross-Dataset Transfer Learning forPerson Reidentification.In IEEE Conference on Computer Vision and PatternRecognition.1306-1315;H.Wang,S.Gong,and T.Xiang.2014.Unsupervised learning ofgenerative topic saliency for person re-identification.British Machine VisionAssociation Bmva(2014)),这种方法引入的数据由于不满足独立同分布的先决条件,往往会引入很多的误差,性能提升很有限;第三种是通过对已有的数据集进行线性变换,从而得到更多的数据对数据集进行扩充(参见Niall Mclaughlin,Jesus Martinez Del Rincon,and Pau1 Miller.2015.Data-augmentation for reducing dataset bias in personreidentification.In IEEE International Conference on Advanced Video andSignal Based Surveillance.1-6),这种方法无法提供多样性的扩充样本,并且扩充的数据集鲁棒性不够好,实施复杂度过高。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710857752.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防摔的计算机显示屏
- 下一篇:一种可自动调节导线针水平位置的线绳绕线机构