[发明专利]一种动态场景下基于语义分割的直接法视觉定位方法有效
申请号: | 202010098733.9 | 申请日: | 2020-02-18 |
公开(公告)号: | CN111340881B | 公开(公告)日: | 2023-05-19 |
发明(设计)人: | 潘树国;盛超;高旺;谭涌;赵涛;喻国荣 | 申请(专利权)人: | 东南大学 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06V10/26;G06V10/82;G06N3/09 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 动态 场景 基于 语义 分割 直接 视觉 定位 方法 | ||
1.一种动态场景下基于语义分割的直接法视觉定位方法,其特征在于,包括以下步骤:
步骤1、采集原始图像,并利用深度学习中的图像语义分割技术分割所述原始图像中的动态物体,获得包含动态物体像素级语义信息的语义图像;
步骤2、在所述原始图像中提取候选点,并根据步骤1获取的语义图像剔除动态区域候选点,仅保留静态区域候选点;
步骤3、基于步骤2中保留的静态区域候选点,结合图像金字塔模型和步骤1获取的语义图像估计相机位姿;
步骤4、基于滑动窗口和步骤1获得的语义图像对关键帧位姿进行优化;
在步骤2中,在原始图像中提取候选点,并保留静态区域候选点,具体包含如下步骤:
步骤2.1、对于关键帧Ii,将其划分成d×d的图像块;
步骤2.2、设定梯度阈值T,对于每一个图像块,选择在该图像块的所有像素点中梯度最大且大于阈值T的像素点p作为预选候选点;
步骤2.3、若图像块中所有像素点的梯度均小于阈值T,令T′=0.75×T,选择在该图像块的所有像素点中梯度最大且大于阈值T′的像素点p作为预选候选点;
步骤2.4、设定像素间隔D,记p点上、下、左、右间隔为D的四个像素点为p1,p2,p3,p4;
步骤2.5、对于p点及其相邻的p1,p2,p3,p4,根据语义图像中对应位置的像素值判断是否将p点保存为候选点:
若中,有一项为0,则认为预选候选点p处于动态区域,执行剔除操作;
若全部为1,则认为预选候选点p处于静态区域,执行保留操作;
在步骤3中,采用金字塔模型恢复相机运动,具体包含如下步骤:
步骤3.1、对于关键帧Ii,以0.5的缩放因子对图像进行缩放,分别获得相对于Ii分辨率的图像,将Ii与缩放后的三张图像按照分辨率由低到高的顺序构造图像金字塔,图像金字塔第k层图像记为并对金字塔各层进行如步骤2所述的静态区域候选点提取;
步骤3.2、对于后续帧Ij及其对应的语义图像构造与步骤3.1同样的图像金字塔,图像金字塔第k层的图像和对应的语义图像分别记为和
步骤3.3、对于中的单个候选点p,计算其投影到图像上形成的光度误差:
其中,p′是p在上的投影点,ti和tj分别是图像Ii和Ij的曝光时间,ai,aj,bi,bj是图像的光度传递函数参数,Np是包括p点及周围相邻点共8个点的集合,wp是权重因子,||.||γ是Huber范数;
步骤3.4、对于每个候选点p,根据其在中投影点p′的位置,计算一个剔除标签决定该点的投影残差是否去除:
步骤3.5、将中各点的投影残差进行累加,并剔除投影到动态区域的残差,得到了金字塔第k层的投影残差和:
步骤3.6、以在k-1层的相对位姿优化结果Tk-1作为本次优化的初值,利用高斯牛顿法对进行优化,可以获得第k层的关键帧和第k层的后续帧之间的相对位姿Tk;
步骤3.7、对金字塔的所有层按照由上至下的顺序重复步骤3.3-3.6,最终获得关键帧Ii和后续帧Ij之间的相对位姿。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098733.9/1.html,转载请声明来源钻瓜专利网。