[发明专利]一种用于非连续监控路段的视频预测方法在审
申请号: | 201910987781.0 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110769196A | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 史再峰;任辉政;罗韬;瑟福;樊强强 | 申请(专利权)人: | 天津大学 |
主分类号: | H04N7/18 | 分类号: | H04N7/18;G08G1/017 |
代理公司: | 12107 天津市三利专利商标代理有限公司 | 代理人: | 韩新城 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频序列 视频预测 生成模型 网络 监控路段 网络模型 非连续 鉴别 公共数据库 训练集数据 摄像头 交通监管 输入预测 网络训练 学习训练 导出 构建 输出 对抗 预测 学习 | ||
1.一种用于非连续监控路段的视频预测方法,其特征在于,包括步骤:
S1.构建基于生成对抗网络的视频预测生成模型GAN:
所述视频预测生成模型GAN由生成网络G和鉴别网络D组成;
所述鉴别网络D通过学习训练以正确区分由生成网络G生成的视频序列与真实视频序列Y;
S2.将训练集数据输入预测生成模型GAN进行网络训练;
S3.将测试集数据输入S2训练完成的网络模型中,测试评估网络性能,若反馈的性能指标指标不符合要求,则调整超参数与各权重初始值,重复步骤S2,重新训练网络及评估过程,直到符合要求;
S4.将训练完成的生成网络模型参数导出,利用一组来自网络公共数据库的真是视频序列作为输入数据,通过该生成网络模型输出相应的预测的视频序列。
2.根据权利要求1所述用于非连续监控路段的视频预测方法,其特征在于,所述生成对抗网络的损失函数为二元交叉熵损失函数,计算方法为:
其中,D(Yk),D(G(Xt))分别表示鉴别网络D判断样本Yk,来自真实视频帧数据集数据Y的概率,其中和分别指当视频序列数据中变量Yk符合概率密度函数Pdata(Yk)时对应于[D(Yk)-1]2的期望值与当Xt符合概率密度函数Pdata(Xt)时对应于[D(Xt)-1]2的期望值。
3.根据权利要求2所述用于非连续监控路段的视频预测方法,其特征在于,对生成网络G和鉴别网络D的训练过程可以用下式表示:
其中G*,D*分别是生成网络G和鉴别网络D的最优解训练目标,是获得令鉴别网络D鉴别准确率最高的权重参数和具有对鉴别网络最强欺骗能力的生成网络G的权重参数。
4.根据权利要求2所述用于非连续监控路段的视频预测方法,其特征在于,生成网络G和鉴别网络D的训练过程为以下两个步骤A、B的迭代过程:
步骤A是固定生成网络权重参数,基于预设的鉴别网络的学习率等超参数值,利用梯度下降法训练鉴别网络以更新其权重等参数值;步骤B是固定鉴别网络权重参数,利用梯度下降法训练生成网络以更新其权重等参数值;
其中步骤A、B的迭代过程是,多次执行步骤A后,执行一次步骤B,重复该迭代过程,直至总损失函数最低,即鉴别网络无法鉴别生成网络生成的视频帧序列和真实视频帧序列时,即完成训练。
5.根据权利要求1所述用于非连续监控路段的视频预测方法,其特征在于,步骤S2所述训练集数据以及用于验证步骤S2获得的网络模型的测试集数据,是将来自网络公共数据库的数据进行人工标注和扩充所得到,最终得到的数据集按8:2的比例分组,分别得到训练集数据和测试集数据。
6.根据权利要求5所述用于非连续监控路段的视频预测方法,其特征在于,所述的标注过程为通过计算机脚本对视频序列中每个目标对象添加标签信息。
7.根据权利要求5所述用于非连续监控路段的视频预测方法,其特征在于,所述扩充数据集的方法包含以下两种方式:
1).对来自网络公共数据库的视频数据集进行复制并人工处理以扩充视频序列数据集,人工处理的方法包括对视频图像的亮度及对比度进行调节,对行人对象及其运动轨迹进行镜像翻转、对视频图像进行随机平移、随机旋转;
2).根据网络公共数据库的视频数据,通过计算机脚本,模拟视频序列中运动目标的大小、初始位置与消失位置的虚拟运动轨迹、运动速度与加速度等状态变量;再通过物理建模简单构建包含背景与运动的多目标的视频序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910987781.0/1.html,转载请声明来源钻瓜专利网。