[发明专利]一种基于生成网络的行人重识别数据生成和扩充方法有效
申请号: | 201710857752.3 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107679465B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 杨华;陈琳;高志勇 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 31317 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人: | 徐红银;刘翠<国际申请>=<国际公布>= |
地址: | 200240*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于生成网络的行人重识别数据生成和扩充方法,步骤为:利用视频预测网络生成新的行人视频帧样本。利用深度生成对抗网络进行端到端的行人背景变换数据生成。利用不同的数据生成方法进行行人数据集的广度和丰富性的扩充。将扩充的数据集送入特征提取网络中提取特征并用欧氏距离评估性能。本方法同时考虑了行人的类内和类间数据扩充,联合利用了不同的生成网络生成更多更丰富的样本,扩充的数据集具有很好的多样性和鲁棒性,能更好的解决与适应由于样本数量不足和背景干扰带来的性能损失,具有普遍的适用性,扩充的数据集在下一步的行人识别中能发挥更好的性能及效率。 | ||
搜索关键词: | 数据生成 数据集 样本 网络生成 背景变换 背景干扰 欧氏距离 视频预测 数据扩充 特征提取 提取特征 行人识别 行人数据 性能损失 网络 鲁棒性 视频帧 送入 多样性 并用 对抗 评估 联合 | ||
【主权项】:
1.一种基于生成网络的行人重识别数据生成和扩充方法,其特征在于:包括以下步骤:/n第一步:基于无监督的视频预测生成网络,形成行人视频预测生成网络P;/n第二步:对行人视频中的每一个图像序列s=(s0,...,sT-1),均经过第一步中的行人视频预测生成网络P生成新的视频帧序列p=(p0,...,pT-1),并同原始视频帧计算生成目标损失函数L并反传进行优化迭代,得到最优模型;其中,sT-1表示第T帧原始图像,pT-1表示第T帧预测图像,上标T表示序列长度;/n第三步:在整个待扩充行人数据集上对第二步得到的最优模型进行应用,对待扩充行人数据集中的每一个行人视频帧,优化得到新的预测帧,并加入到待扩充行人数据集中进行类内视频长度的扩充,得到类内生成数据,用于减少由于数据量不足带来的过拟合现象;/n第四步:基于传统生成对抗网络,形成行人图片生成对抗网络N,其中行人图片生成对抗网络N包含主要由卷积网络构成的生成单元G和描述单元D;/n第五步:对待扩充行人数据集中的每一张输入图片s(t),均经过第四步中的行人图片生成对抗网络N的生成单元G,通过生成单元G生成新的图片o(t);/n第六步:对待扩充行人数据集中的每一张输入图片s(t)所对应的原始背景替换图y(t)和对应的生成图片o(t),均经过第四步中的行人图片生成对抗网络N的描述单元D,通过描述单元D中的损失函数LC(G,D)判别二者的差异损失,并将损失函数LC(G,D)分别反向传播于生成单元G和描述单元D进行对抗迭代优化;/n第七步:加入一范数损失函数,用于减少生成图片的模糊程度;/n第八步:最大化描述单元D的损失,用于使网络能够区分生成图片和原始图片;最小化生成单元G的损失,用于使生成图片能够接近原始图片;进行第六步的对抗迭代优化,得到最优的端到端的背景替换数据生成模型G*;/n第九步:应用第八步的背景替换数据生成模型G*得到新的端到端的背景替换生成图片;将背景替换生成图片加入待扩充行人数据集中进行类间数据扩充,得到类间生成数据,用于增加数据集的多样性,减少背景干扰;/n第十步:利用第三步得到的类内生成数据和第九步得到的类间生成数据对待扩充行人数据集进行扩充,得到最终的扩充数据集,并将最终的扩充数据集送入特征提取网络中提取特征并用欧氏距离评估性能。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710857752.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种防摔的计算机显示屏
- 下一篇:一种可自动调节导线针水平位置的线绳绕线机构