[发明专利]一种基于无监督对偶学习的视频插帧方法有效

专利信息
申请号: 202111296659.2 申请日: 2021-11-04
公开(公告)号: CN114066730B 公开(公告)日: 2022-10-28
发明(设计)人: 李学龙;赵斌;张馥华 申请(专利权)人: 西北工业大学
主分类号: H04N7/01 分类号: H04N7/01;H04N21/4402;G06T3/40;G06N3/08;G06N3/04;G06V20/40;G06V10/82
代理公司: 西安凯多思知识产权代理事务所(普通合伙) 61290 代理人: 王鲜凯
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 监督 对偶 学习 视频 方法
【权利要求书】:

1.一种基于无监督对偶学习的视频插帧方法,其特征在于步骤如下:

步骤1:使用Adobe240-fps视频数据集作为训练集,将其所有视频帧图像中的任意连续12帧图像作为一组数据;

步骤2:从步骤1得到的一组视频帧图像中随机选取连续9帧图像中的第1帧和第9帧图像,分别记为Ii和Ij,输入到无监督的双向光流网络U-Net1中,输出得到双向光流信息Fi→j和Fj→i,其中,Fi→j表示从图像Ii到图像Ij的光流信息,Fj→i表示从图像Ij到图像Ii的光流信息;

所述的无监督的双向光流网络U-Net1由编码器Encoder和解码器Decoder两部分组成,编码器Encoder包含五个模块,每个模块包含两个卷积层和一个池化层,第一个模块卷积层的卷积核大小为7*7、步长为1、填充步长为0,第二个模块卷积层的卷积核大小为5*5、步长为1、填充步长为0,其他模块卷积层的卷积核大小为3*3、步长为1、填充步长为0,每两个卷积层之间用Leaky ReLU激活函数连接,除了最后一个模块,每个模块对卷积层提取的图像特征进行平均池化,池化层的大小为7*7、步长为2、填充步长为3,将两帧图像输入到编码器Encoder,输出得到两帧图像的特征;解码器Decoder包含五个模块,每一个模块包含两个卷积层,卷积层的卷积核大小为3*3、步长为1、填充步长为0,将编码器Encoder输出的图像特征输入到解码器Decoder,输出得到光流信息;

步骤3:分别按下式计算得到中间光流信息和

其中,将两帧图像Ii和Ij间的时间距离视为1,It表示这两帧图像之间t时刻的图像,t为1/2时刻、1/3时刻或1/4时刻;表示从图像It到图像Ii的中间光流信息,表示从图像It到图像Ij的中间光流信息;

步骤4:对图像Ii和中间光流信息进行双线性插值,得到中间帧图像It→i;对图像Ij和中间光流信息进行双线性插值,得到中间帧图像It→j

步骤5:将图像Ii和Ij、双向光流信息Fi→j和Fj→i、中间光流信息和中间帧图像It→i和It→j输入到细化光流模块U-Net2网络中,输出细化后的中间光流信息Ft→i、Ft→j,其中,Ft→i表示图像It到图像Ii的细化后的中间光流信息,Ft→j表示图像It到图像Ij的细化后的中间光流信息;

所述的细化光流模块U-Net2网络包括编码器Encoder和解码器Decoder两部分组成,编码器Encoder包含五个模块,每个模块包含两个卷积层和一个池化层,每个卷积层的卷积核大小为3*3、步长为1、填充步长为0,每两个卷积层之间用Leaky ReLU激活函数连接,除了最后一个模块,每个模块对卷积层提取的图像特征进行平均池化,池化层的大小为7*7、步长为2、填充步长为3;解码器Decoder也包含五个模块,每个模块包含两个卷积层,每个卷积层的卷积核大小均为3*3、步长为1、填充步长为0;

步骤6:按下式计算得到细化后的中间帧图像

其中,表示相乘,warp(·,·)表示对两幅输入图像进行双线性插值处理;V表示中间图像,按照下式计算得到:

V=(1-t)Ct→i+tCt→j (4)

其中,Ct→i表示图像It中的像素点在图像Ii中存在的概率值,Ct→j表示图像It中的像素点在图像Ij中存在的概率值,Ct→i和Ct→j的取值均在0~1之间;

步骤7:将原输入图像Ii和Ij和分别输入到无监督的双向光流网络U-Net1,分别输出双向光流信息F*t→i、F*i→t和F*t→j、F*j→t,其中,F*t→i表示从图像到图像Ii的光流信息,F*i→t表示从图像Ii到图像的光流信息,F*t→j表示从图像到图像Ij的光流信息,F*j→t表示从图像Ij到图像的光流信息;

步骤8:分别按照下式计算得到细化后的双向光流信息F*j→i和F*i→j

其中,F*j→i表示从图像Ij到图像Ii的细化光流信息,F*i→j表示从图像Ii到图像Ij的细化光流信息;

步骤9:对图像Ii和细化光流信息F*j→i进行双线性插值,得到新的图像I*i;对图像Ij和细化光流信息F*i→j进行双线性插值,得到新的图像I*j

步骤10:返回步骤1对网络进行迭代训练,直到网络参数epoch达到300epoch,得到训练好的网络,并以此时得到的细化后的中间帧图像作为最终插帧结果图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111296659.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top