[发明专利]一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法有效
申请号: | 202110930757.0 | 申请日: | 2021-08-13 |
公开(公告)号: | CN113592026B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 邹启杰;于静;高兵;秦静;张洁;孙文;刘圣凯 | 申请(专利权)人: | 大连大学 |
主分类号: | G06V10/75 | 分类号: | G06V10/75;G06V10/774;G06V10/82;G06N3/0464;G06N3/047;G06N3/08 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 毕进 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空洞 卷积 级联 代价 双目 视觉 立体 匹配 方法 | ||
1.一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,具体包括:
先使用残差卷积神经网络对输入的左右立体图像进行特征提取得到特征图,通过分组空洞卷积金字塔池化模块GASPP对所述特征图进行处理,从不同尺度提取待匹配像素的上下文信息,获得多尺度、稠密的特征信息;
堆叠所述特征图构成匹配代价卷,用于度量所述待匹配像素与候选像素之间的相关性;
采用三维堆叠沙漏网络对所述匹配代价卷进行正则化操作,得到原始尺寸特征图;
利用回归函数对原始尺寸特征图进行视差回归操作。
2.根据权利要求1所述一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,所述残差卷积神经网络包括3*3的卷积层,每一卷积层后面均有批规则化层、RELU激活函数层。
3.根据权利要求1所述一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,所述分组空洞卷积金字塔池化模块GASPP设计了四组空洞卷积层,并在组内分配两组连续小的扩张率卷积层;各组之间的扩张率呈增大趋势,形成{(2,3)(5,6)(8,9)(11,12)}四个平行分支,提供不同尺度的空间信息特征图,且四个平行分支相互补充,最后将输出进行累积,得到包含多尺度空间信息的特征图,其公式表达如下:
y=G13,2(x)+G13,3(x)+G23,5(x)+G23,6(x)+G33,8(x)+G33,9(x)+G43,11(x)+G43,12(x)
其中,GnK,d(x)代表一个分组空洞卷积;d为扩张率的大小,K代表核的尺寸大小,n为组号。
4.根据权利要求1所述一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,构成匹配代价卷分为两个阶段,第一阶段为:对特征图体积进行处理,通过卷积层将初始通道数量由32个改变为320个,与残差卷积神经网络的通道数量一致;第二阶段为:使用一个2D卷积层将特征通道数量减少到160个,然后使用另一个2D卷积层将特征通道数量减少到80个。
5.根据权利要求1所述一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,所述堆叠沙漏网络中编码器利用3个3D卷积层进行下采样,解码器对称使用3个3D反卷积层来进行上采样操作;最后通过双边线性插值方法恢复特征图到原始尺寸,得到匹配代价矩阵。
6.根据权利要求5所述一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,对匹配代价矩阵进行视差回归操作,正则化处理来得到每个像素属于不同视差的概率;然后以概率值作为权重,对视差进行加权求和,得到每个像素点平滑的视差估计结果,如下式:
其中d代表视差,σ(-cd)则代表了相应点的可能性;则代表预测视差。
7.根据权利要求6所述一种基于空洞卷积和级联代价卷的双目视觉立体匹配方法,其特征在于,通过损失函数来获得最终视差图,所述损失函数为:
λk代表第k个视差预测的系数,代表了该点实际视差值;预测视差值为损失函数具体如下:
其中x是损失函数的自变量,通过梯度下降的方法来降低损失函数的值,不断迭代直至损失函数的值到达最低,不再下降;此时视差回归达到收敛,取其作为最终视差图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110930757.0/1.html,转载请声明来源钻瓜专利网。