[发明专利]一种基于无监督对偶学习的视频插帧方法有效
| 申请号: | 202111296659.2 | 申请日: | 2021-11-04 |
| 公开(公告)号: | CN114066730B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 李学龙;赵斌;张馥华 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | H04N7/01 | 分类号: | H04N7/01;H04N21/4402;G06T3/40;G06N3/08;G06N3/04;G06V20/40;G06V10/82 |
| 代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 王鲜凯 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 监督 对偶 学习 视频 方法 | ||
1.一种基于无监督对偶学习的视频插帧方法,其特征在于步骤如下:
步骤1:使用Adobe240-fps视频数据集作为训练集,将其所有视频帧图像中的任意连续12帧图像作为一组数据;
步骤2:从步骤1得到的一组视频帧图像中随机选取连续9帧图像中的第1帧和第9帧图像,分别记为Ii和Ij,输入到无监督的双向光流网络U-Net1中,输出得到双向光流信息Fi→j和Fj→i,其中,Fi→j表示从图像Ii到图像Ij的光流信息,Fj→i表示从图像Ij到图像Ii的光流信息;
所述的无监督的双向光流网络U-Net1由编码器Encoder和解码器Decoder两部分组成,编码器Encoder包含五个模块,每个模块包含两个卷积层和一个池化层,第一个模块卷积层的卷积核大小为7*7、步长为1、填充步长为0,第二个模块卷积层的卷积核大小为5*5、步长为1、填充步长为0,其他模块卷积层的卷积核大小为3*3、步长为1、填充步长为0,每两个卷积层之间用Leaky ReLU激活函数连接,除了最后一个模块,每个模块对卷积层提取的图像特征进行平均池化,池化层的大小为7*7、步长为2、填充步长为3,将两帧图像输入到编码器Encoder,输出得到两帧图像的特征;解码器Decoder包含五个模块,每一个模块包含两个卷积层,卷积层的卷积核大小为3*3、步长为1、填充步长为0,将编码器Encoder输出的图像特征输入到解码器Decoder,输出得到光流信息;
步骤3:分别按下式计算得到中间光流信息和
其中,将两帧图像Ii和Ij间的时间距离视为1,It表示这两帧图像之间t时刻的图像,t为1/2时刻、1/3时刻或1/4时刻;表示从图像It到图像Ii的中间光流信息,表示从图像It到图像Ij的中间光流信息;
步骤4:对图像Ii和中间光流信息进行双线性插值,得到中间帧图像It→i;对图像Ij和中间光流信息进行双线性插值,得到中间帧图像It→j;
步骤5:将图像Ii和Ij、双向光流信息Fi→j和Fj→i、中间光流信息和中间帧图像It→i和It→j输入到细化光流模块U-Net2网络中,输出细化后的中间光流信息Ft→i、Ft→j,其中,Ft→i表示图像It到图像Ii的细化后的中间光流信息,Ft→j表示图像It到图像Ij的细化后的中间光流信息;
所述的细化光流模块U-Net2网络包括编码器Encoder和解码器Decoder两部分组成,编码器Encoder包含五个模块,每个模块包含两个卷积层和一个池化层,每个卷积层的卷积核大小为3*3、步长为1、填充步长为0,每两个卷积层之间用Leaky ReLU激活函数连接,除了最后一个模块,每个模块对卷积层提取的图像特征进行平均池化,池化层的大小为7*7、步长为2、填充步长为3;解码器Decoder也包含五个模块,每个模块包含两个卷积层,每个卷积层的卷积核大小均为3*3、步长为1、填充步长为0;
步骤6:按下式计算得到细化后的中间帧图像
其中,表示相乘,warp(·,·)表示对两幅输入图像进行双线性插值处理;V表示中间图像,按照下式计算得到:
V=(1-t)Ct→i+tCt→j (4)
其中,Ct→i表示图像It中的像素点在图像Ii中存在的概率值,Ct→j表示图像It中的像素点在图像Ij中存在的概率值,Ct→i和Ct→j的取值均在0~1之间;
步骤7:将原输入图像Ii和Ij和分别输入到无监督的双向光流网络U-Net1,分别输出双向光流信息F*t→i、F*i→t和F*t→j、F*j→t,其中,F*t→i表示从图像到图像Ii的光流信息,F*i→t表示从图像Ii到图像的光流信息,F*t→j表示从图像到图像Ij的光流信息,F*j→t表示从图像Ij到图像的光流信息;
步骤8:分别按照下式计算得到细化后的双向光流信息F*j→i和F*i→j:
其中,F*j→i表示从图像Ij到图像Ii的细化光流信息,F*i→j表示从图像Ii到图像Ij的细化光流信息;
步骤9:对图像Ii和细化光流信息F*j→i进行双线性插值,得到新的图像I*i;对图像Ij和细化光流信息F*i→j进行双线性插值,得到新的图像I*j;
步骤10:返回步骤1对网络进行迭代训练,直到网络参数epoch达到300epoch,得到训练好的网络,并以此时得到的细化后的中间帧图像作为最终插帧结果图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111296659.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:回收系统
- 下一篇:一种风冷冰箱的化霜控制方法及风冷冰箱





