[发明专利]一种基于GAN网络深度学习模型的光流估计方法在审
申请号: | 201711386897.6 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108122249A | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 张智福;余思洋;陈捷;郭玉其 | 申请(专利权)人: | 长沙全度影像科技有限公司 |
主分类号: | G06T7/269 | 分类号: | G06T7/269 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410205 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光流估计 学习 光流 构建 网络 图像 图像处理领域 多维特征 估计运动 快速估计 输入图像 图像输入 图像特征 学习数据 自动学习 端到端 反卷积 数据集 准确率 残差 卷积 挖掘 | ||
1.一种基于GAN网络深度学习模型的光流估计方法,其特征在于,包括以下步骤:
步骤1:构建光流估计的深度学习数据集;
步骤2:构建GAN网络深度学习模型,该模型包括卷积模块,残差模块和反卷积模块;
步骤3:利用数据集对深度学习模型进行训练,得到训练完成的深度学习模型;
步骤4:直接将待估计光流的图像输入训练完成的深度学习模型,快速估计出光流图像。
2.根据权利要求1所述的基于GAN网络深度学习模型的光流估计方法,其特征在于:所述步骤1中光流估计深度学习数据集中的样本数量不少于20000,其中每个样本包含运动视频中两帧相邻图像和这两帧图像所对应的光流图像。
3.根据权利要求1所述的基于GAN网络深度学习模型的光流估计方法,其特征在于:所述步骤2中的卷积模块包括4个卷积层,残差模块包括5个子网络,其中每个子网络包括1个卷积层,1个归一化层和1个ReLU激活层,反卷积模块包括4个反卷积层,反卷积模块中每个反卷积层在作反卷积时调用对应卷积层的图像特征,上一层的输出结果作为下一层的输入。
4.根据权利要求1所述的基于GAN网络深度学习模型的光流估计方法,其特征在于:所述步骤3中训练深度学习模型使用Caffe框架。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙全度影像科技有限公司,未经长沙全度影像科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711386897.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于视频测量的大坝自振频率识别方法
- 下一篇:用于立体匹配的方法和设备