[发明专利]一种基于深度学习的视觉SLAM定位方法在审
| 申请号: | 202010366574.6 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111578956A | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 陈星瀚;肖敏;叶葛旺 | 申请(专利权)人: | 上海谦尊升网络科技有限公司 |
| 主分类号: | G01C21/32 | 分类号: | G01C21/32;G01C21/20;G06N3/04;G06N3/08 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 陈选中 |
| 地址: | 200335 上海市长*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 视觉 slam 定位 方法 | ||
1.一种基于深度学习的视觉SLAM定位方法,其特征在于,包括以下步骤:
S1、采用图像数据集训练得到用于实现视觉里程计功能的神经网络模型;
S2、通过神经网络模型进行闭环检测;
S3、根据闭环检测结果,采用后端优化算法,并结合视觉里程计对机器人运动轨迹进行优化,实现视觉SLAM定位。
2.根据权利要求1所述的视觉SLAM定位方法,其特征在于,所述步骤S1包括以下分步骤:
S11、对图像数据集中的图像数据进行预处理,并将图像数据集分为训练集、测试集和验证集;
S12、采用训练集训练用于实现视觉里程计功能的神经网络模型;
S13、采用验证集对训练后的神经网络模型进行验证,若验证效果合格则进入步骤S14,否则查找问题、返回步骤S12继续训练或者更换神经网络模型;
S14、采用测试集对验证效果合格的神经网络模型进行测试,若测试效果符合算法阈值则选定当前的神经网络模型用于实现视觉里程计功能,否则查找问题、返回步骤S12继续训练或者更换神经网络模型。
3.根据权利要求2所述的视觉SLAM定位方法,其特征在于,所述步骤S11中对图像数据集中的图像数据进行预处理包括图像数据去噪和图像大小的调整。
4.根据权利要求2所述的视觉SLAM定位方法,其特征在于,所述步骤S12中训练用于实现视觉里程计功能的神经网络模型包括确定神经网络的输入和输出、采用卷积层和池化层的数量以及采用的激活函数。
5.根据权利要求1所述的视觉SLAM定位方法,其特征在于,所述步骤S2包括以下分步骤:
S21、提取神经网络模型不同网络层的输出特征,并对输出特征进行降维处理;
S22、根据不同网络层的输出特征降维的形式,采用多层网络特征级联的方式作为图像描述符,并选定最佳组合方式;
S23、根据最佳组合方式得到图像描述子,并对图像描述子进行归一化操作;
S24、根据归一化后的图像描述子,采用相似性算法,计算图像数据集的相似度矩阵,并优化相似度矩阵,做出闭环的判断。
6.根据权利要求5所述的视觉SLAM定位方法,其特征在于,所述步骤S23中对图像描述子进行归一化操作的公式为:
其中img_proc表示归一化后的图像描述子,img表示特征级联之后的图像特征矩阵,表示img的L2范数,d表示神经网络模型某一层的输出维度。
7.根据权利要求5所述的视觉SLAM定位方法,其特征在于,所述步骤S24具体为:计算第i帧图像li与第j帧图像lj的相似度Sim(i,j):
其中表示第i帧图像li归一化后的图像描述子,表示第j帧图像lj归一化后的图像描述子,表示第i帧图像li与第j帧图像lj的差异大小,Sim(i,j)∈[0,1];
确定阈值Th,若Sim(i,j)≥Th,则判断为闭环,否则判断为非闭环。
8.根据权利要求1所述的视觉SLAM定位方法,其特征在于,所述步骤S3具体为:若检测到有闭环存在,则采用后端优化算法进行反向优化,得到精确的机器人的运动轨迹,并构建地图,实现视觉SLAM定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海谦尊升网络科技有限公司,未经上海谦尊升网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010366574.6/1.html,转载请声明来源钻瓜专利网。





