[发明专利]一种视点合成技术进行立体校正的方法有效
申请号: | 202110386736.7 | 申请日: | 2021-04-09 |
公开(公告)号: | CN113077401B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 李铭;杜歆 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00;G06K9/62;G06N3/04;G06V10/774;G06V10/82 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视点 合成 技术 进行 立体 校正 方法 | ||
1.一种视点合成技术进行立体校正的方法,其特征在于,包括以下步骤:
(1)通过对立体视频进行帧提取,构建立体图像训练数据集;
(2)构建并训练未校正立体图像视差估计网络,并利用训练后的未校正立体图像视差估计网络计算左视图IL的水平视差图DLh和垂直视差图DLv,以及右视图IR的水平视差图DRh和垂直视差图DRv;
(3)利用左右视图的水平和垂直视差图DLh、DRh、DLv、DRv以及左右视图IL、IR,做像素映射,得到待修复的虚拟右视图Ihole;
(4)构建并训练基于参考视图的图像修复网络,并利用训练后的基于参考视图的图像修复网络生成最终修复后的虚拟右视图Ipred;左视图IL和修复后的虚拟右视图Ipred即为校正结果;
所述的步骤(4)中构建的基于参考视图的图像修复网络由编码器、中间卷积层和解码器组成,其中编码器中包含了指导模块引入指导特征;编码器首先由四个卷积核大小分别为7x7、4x4、4x4、3x3,步长分别为2、2、2、2,输出通道数分别为64、128、256、256的卷积层对待修复的虚拟右视图Ihole输入的待修复图像和空洞模板M合并后的向量提取输入图像特征Fi;原始左右视图IL、IR作为参考视图,分别用估计得到的左图水平视差DLh和右图垂直视差DRv通过像素映射从左右视点映射到合成视点位置,再分别与空洞模板M合并,由四个卷积层的卷积核大小分别为7x7、4x4、4x4、3x3,步长分别为2、2、2、2,输出通道数分别为64、128、256、256,通过权值共享的方式提取参考图像特征;四个卷积层从左右视图中获得左右参考图像特征Fl1,Fl2,Fl3,Fl4和Fr1,Fr2,Fr3,Fr4;随后参考图像特征Fl4和输入图像特征Fi进行通道合并后经过三个卷积核为3x3,输出通道为256,128,1的卷积层,在最后一个卷积层后紧接着一个sigmoid函数生成单通道的左注意力特征图Fla,参考特征Ft4和Fi进行通道合并后经过同样的三个卷积核为3x3,输出通道为256,128,1的卷积层,接着一个sigmoid函数生成单通道的右注意力特征图Fra;Fla与Fl4相乘,Fra与Fr4相乘后相加获得指导特征Fguide;获得的指导特征Fguide和输入图像特征Fi合并后经过一个输出通道为512,卷积核大小为4x4,步长为2的卷积层得到图像深层编码特征F5;
中间卷积层由三个输出通道为512的4x4卷积层构成,由图像深层编码特征F5得到深度融合特征Fdec5;
解码器由五个解卷积层构成;通过残差连接将F5与Fdec5合并,经过一个卷积核大小为3x3,输出通道为256的解卷积层后得到解卷积特征Fdec4;Fdec4,Fl4,Fr4合并后由一个卷积核大小为4x4,输出通道为128的解卷积层得到解卷积特征Fdec3;Fdec3,Fl3,Fr3合并后由一个卷积核大小为4x4,输出通道为128的解卷积层得到解卷积特征Fdec2;Fdec2,Fl2,Fr2合并后由一个卷积核大小为4x4,输出通道为64的解卷积层得到解卷积特征Fdec1;Fdec1,Fl1,Fr1合并后由一个卷积核大小为4x4,输出通道为3的解卷积层得到Ipred,即修复后的虚拟右视图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110386736.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种农用谷物收割的高效筛分装置
- 下一篇:骨块提拉固定装置及安装方法