[发明专利]一种基于PSMNet改进的双目立体匹配方法在审
| 申请号: | 202010217365.5 | 申请日: | 2020-03-25 | 
| 公开(公告)号: | CN111583313A | 公开(公告)日: | 2020-08-25 | 
| 发明(设计)人: | 罗炬锋;蒋煜华;李丹;曹永长;偰超;张力;崔笛扬;郑春雷 | 申请(专利权)人: | 上海物联网有限公司 | 
| 主分类号: | G06T7/33 | 分类号: | G06T7/33;G06N3/04;G06N3/08 | 
| 代理公司: | 上海泰能知识产权代理事务所 31233 | 代理人: | 宋缨 | 
| 地址: | 201800 上海市嘉*** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 psmnet 改进 双目 立体 匹配 方法 | ||
本发明涉及一种基于PSMNet改进的双目立体匹配方法,包括:获取双目图像,构建基于PSMNet的主干网络;该网络包括:深度卷积网络,用于提取所述双目图像的左右特征图;金字塔池化结构,用于提取所述左右特征图的多尺度目标特征;匹配代价卷,用于将多尺度目标特征进行代价聚合,得到3D特征模块;3D卷积结构,用于对3D特征模块进行后续代价计算;通过引入通道注意力机制对不同特征点赋予不同的权重来改进匹配代价卷的结构;设计基于编码过程和解码过程的网络结构来改进3D卷积结构,得到改进后的基于PSMNet的主干网络;再对所述双目图像进行立体匹配。本发明的立体匹配方法能使网络结构获得更快的训练时间、更高的视差精度,具有较好的实用性。
技术领域
本发明涉及计算机视觉应用技术领域,特别是涉及一种基于PSMNet改进的双目立体匹配方法。
背景技术
立体视觉是计算机视觉领域的一个重要课题,它的目的在于重构场景的三维几何信息,我们可以利用双目立体相机来获得当前场景的左右视图,然后利用立体匹配算法来计算得到当前场景的深度信息。立体匹配是立体视觉中获取目标深度信息的关键部分,其目标是在两个或多个视点中匹配相应像素点,计算视差和深度,从而得到该场景的三维信息。
一个完整的立体匹配算法通常包含四步:匹配代价计算、代价聚合、视差计算、视差细化。传统的立体匹配方法主要利用局部区域法、动态规划法等方法来获得视差图,但这类视差图往往存在很多空洞,故需要进行一系列的后处理步骤来完善视差信息和填补视差空洞。随着深度学习大发展,视差图的获取不再拘泥于传统的立体匹配算法,而是通过设计深度卷积网络来直接预测场景的稠密视差图。得益于卷积神经网络强大的表征能力,基于深度学习的立体匹配算法相比于传统方法能够更加精确的对场景目标进行视差估计。
Zbontar和LeCun首次提出了使用孪生网络来计算左右视图的匹配代价,他们以一对9×9大小的图像块作为孪生网络的输入,将该网络的输出设为左右两张图像块的相似度,并对网络进行训练,他们的方法是一种典型的立体匹配方法计算过程,其后处理步骤包括代价聚合、半全局匹配、视差精细化等,该方法得到的视差图相比于使用滑框进行匹配代价计算的传统方法精度更高。Luo等人于2016年提出了更快的孪生网络来进行匹配代价的计算,作者将匹配代价的计算视为多标签分类问题来提升推理速度。Shaked和Wolf[于2017年提出了一种用于匹配成本计算的高速网络和一种用于预测视差置信度得分的全局视差网络,该网络有助于进一步完善视差图。但这类基于CNN的立体匹配算法往往只是将孪生网络用于匹配代价计算,计算后的视差值仍然需要使用后处理来提高其精度。
近几年来,研究者在立体匹配算法中的主要研究内容是利用卷积神经网络直接端到端的生成场景视差图,摒弃了一系列的后处理优化步骤。Mayer等人2016年率先提出了端到端的视差计算网络DispNet,并提供了一个庞大的立体匹配数据集Scene Flow供模型进行训练。Pang等人在DispNet的基础上引入了一个称为级联残差学习(CRL)的两阶段网络,该网络第一阶段和第二阶段分别计算视差图及其多尺度残差,然后将两个阶段的输出以求和形成生成最终的视差图。Kendall等人于2017年提出了GCNet,该网络通过将左特征图中的每一个像素点与右特征图中同一极线上所有可能的匹配像素进行密集比较来生成一个尺寸为d×h×w×c的3D代价卷,然后通过3D卷积对该代价卷进行信息提取,最后通过soft-argmin操作来得到最佳匹配视差。JiaRen Cheng等人在GCNet的基础上提出了PSMNet,作者在立体匹配网络中引入了金字塔池化结构来进行多尺度特征提取,同时在3D CNN中使用沙漏结构来获取上下文信息,最终实现了比GCNet更优的视差效果。
发明内容
本发明所要解决的技术问题是提供一种基于PSMNet改进的双目立体匹配方法,针对双目图像、视频能计算出高精度的视差图。
本发明解决其技术问题所采用的技术方案是:提供一种基于PSMNet改进的双目立体匹配方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海物联网有限公司,未经上海物联网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010217365.5/2.html,转载请声明来源钻瓜专利网。





