[发明专利]一种基于对抗网络学习的视频的车辆检测方法和计数方法在审
申请号: | 201710556593.3 | 申请日: | 2017-07-10 |
公开(公告)号: | CN107563274A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 任子晖;李铮;张丽君;张兆义;高洪昌;胡俊;孙林 | 申请(专利权)人: | 安徽四创电子股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 合肥和瑞知识产权代理事务所(普通合伙)34118 | 代理人: | 王挺 |
地址: | 230088 安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 网络 学习 视频 车辆 检测 方法 计数 | ||
技术领域
本发明涉及图像检测技术领域,尤其涉及一种基于对抗网络学习的视频的车辆检测方法和计数方法。
背景技术
视频中车辆的检测与自动计数一直困扰智能交通的流量分析统计,由于视频环境下,车辆的种类、形态各异,此外视频中图像受各种噪声干扰严重,人工无法完成大规模的车辆统计分析。现行的视频车辆的检测与计数工作主要是依靠常规机器学习算法完成的,但视频中图像背景复杂,处理信息规模大,致使视频车辆难以准确的分析与统计。
同时,由于视频中的车辆视频图像背景复杂,外观、姿态等影响,使得传统的车辆自动检测与计数方法效率低、鲁棒性差,且只能存在于实验阶段难以实际应用。
因此,如何能够提高视频中车辆的检测与自动计数的准确性已经成为急需解决的技术问题。
发明内容
本发明为了克服上述现有技术的不足,本发明提供了一种基于对抗网络学习的视频的车辆检测方法和计数方法,本发明能够有效地提高视频中的车辆检测与自动技术的准确性。
为实现上述目的,本发明采用以下技术方案:
一种基于对抗网络学习的视频的车辆检测方法,包括以下步骤:
S1、车辆视频图像的获取;收集若干幅未处理的车辆视频图像作为训练图像,将训练图像归一化处理,得到多幅归一化后的车辆视频图像,作为车辆视频图像训练样本;
S2、获得车辆视频图像检测模型;对条件约束下的视频图像判别网络D(x,l)、视频图像生成网络G(z,l)进行构造与对抗训练;另外获取车辆视频图像负样本,所述车辆视频图像负样本为若干幅归一化后的非车辆视频图像;将车辆视频图像负样本与车辆视频图像训练样本输入到对抗训练后的视频图像判别网络D(x,l)中,从对抗训练后的视频图像判别网络D(x,l)中提取车辆视频图像对抗特征,组成对抗特征向量,将对抗特征向量经过分类器训练,获得车辆视频图像检测模型;
S3、待检测车辆视频图像的获取;收集若干幅未处理的待检测车辆视频图像,并将未处理的待检测车辆视频图像的大小归一化,得到多幅归一化后的待检测车辆视频图像;
S4、车辆在车辆视频图像中具体位置的标记;将待检测车辆视频图像输入到所述的车辆视频图像检测模型,进行车辆的检测,定位并标记出车辆在视频图像中的具体位置。
进一步地,步骤S2包括以下步骤:
S21、构造带条件约束的视频图像判别网络D(x,l)和构造l~pl(l)表示条件约束分布N(α,δ^2);l~pl(l)的公式为:其中x表示图像数据,l表示的是服从高斯分布的条件参数;α、δ^2为分布的参数,设定为车辆姿态或车辆运动状态;
S22、构造带条件约束的视频图像生成网络G(z,l)和构造z~pz(z)表示高斯噪声分布N(μ,σ^2);z~pz(z)的公式为:其中z表示高斯噪声分布,l表示条件约束分布且设定为车辆姿态分布或车辆运动状态分布;μ、σ^2为分布的参数,分别为高斯分布的期望和方差;
S23、条件约束下视频图像判别网络D(x,l)和视频图像生成网络G(z,l)的对抗训练,得到对抗训练后的待条件的约束的视频图像判别网络D(x,l);
S24、获取车辆视频图像负样本;收集若干幅非车辆视频图像作为未处理的车辆视频图像负样本,收集的未处理的车辆视频图像负样本的焦点集中在视频中车辆之外的图像区域,将所有未处理的车辆视频图像负样本的大小归一化处理,得到多幅归一化后的车辆视频图像负样本;
S25、提取车辆视频图像对抗特征;将车辆视频图像训练样本及车辆视频图像负样本作为输入,输入到训练后的带条件约束的视频图像判别网络D(x,l),并将带条件约束的视频图像判别网络D(x,l)的深度卷积神经网络的其中一层作为车辆视频图像对抗特征输出;
S26、收集车辆视频图像对抗特征,组成对抗特征向量;
S27、将对抗特征向量经过分类器训练,得到车辆视频图像检测模型。
进一步地,条件约束下视频图像判别网络D(x,l)和视频图像生成网络G(z,l)的对抗训练,其具体步骤如下:
S231、将视频图像判别网络D(x,l)和视频图像生成网络G(z,l)进行对抗训练,其训练模型如下:[logD(x,l)]+[log(1-D(G(z,l),l))];
其中:log()为对数函数,x为多幅车辆视频图像训练样本;
S232、调整D(x,l)的参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽四创电子股份有限公司,未经安徽四创电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710556593.3/2.html,转载请声明来源钻瓜专利网。