[发明专利]一种基于3D卷积的深度补全方法有效
申请号: | 202110317990.1 | 申请日: | 2021-03-25 |
公开(公告)号: | CN112907573B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 潘树国;章辉;高旺;赵涛;谭涌 | 申请(专利权)人: | 东南大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/50;G06V10/44;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 深度 方法 | ||
1.一种基于3D卷积的深度补全方法,其特征在于:包括以下步骤:
(1)对RGB图像进行特征提取;
所述对RGB图像进行特征提取方法表示为:
选取像素点并设置阈值,之后找到一该点为圆心的半径为3的圆上的16个像素点,选择FAST-12方式完成特征点的判定,再对每个点进行以上的判定,完成特征的提取;
(2)生成稀疏深度测量S,对于多源多模态数据进行数据融合,作为深度学习的先验信息,对个网络进行训练;
所述的对于多源多模态数据进行数据融合,生成多模态融合数据,具体方法是:
对于多源多模态数据,首先完成坐标系的统一,将不同传感器的测量结果通过下述公式进行统一:
Xc=TcX
公式中的Xc和X表示一个相同的目标点在相机坐标系和其他传感器坐标系下的坐标,Tc表示其两个坐标系之间的转换关系矩阵,由旋转矩阵和平移向量组成;
同时还需要完成通过针孔相机模型将Xc投影到相机平面上以获得像素坐标u:
u=KXc
其中K表示相机内参矩阵,fx和fy表示相机在x和y轴上的焦距,(cx,cy)是相机光圈的中心位置;
而生成稀疏深度测量S,则通过在深度图像D*上获得像素集U,其包括带有真实深度测量的线束坐标u,对于没有深度测量的图像,在深度图像D*上将他们设置为零,在生成稀疏深度图过程中,使用伯努利概率其中m是采样深度像素的目标数量,n是集合U中的有效深度像素总数,对于每个像素(i,j),有
其中temp是区间[0,1]中的随机数,对于每个像素应用此操作,生成稀疏深度测量S,最后将RGB图像与稀疏深度测量S,组成多模态融合数据RGBS,同时作为深度学习的先验信息,对神经网络进行训练;
(3)通过随机变换以在线方式增加训练数据;
(4)模态特征提取;
针对输入信号包含RGB图像和稀疏深度的多模态信息,且2D卷积操作无法保留其模态信息的问题,利用3D卷积对RGB图像和稀疏深度进行特征融合,在网络对输入数据进行特征提取的同时保留其模态特征,以充分挖掘数据信息提高深度补全的精度,其中标准的三维卷积计算公式如下:
其中
2.根据权利要求1所述的一种基于3D卷积的深度补全方法,其特征在于:步骤(3)通过随机变换以在线方式增加训练数据:
a)尺度变换:对彩色图像和稀疏深度按随机数s∈[1,1.15],利用双线性插值进行放大;
b)随机裁剪:将尺度变换后的RGB图像和深度随机裁剪,使其与输入大小一致;
c)颜色调整:对彩色图像的亮度,对比度和饱和度均按ki∈[0.6,1.4]进行缩放;
d)颜色标准化:彩色图像通过平均减法和除以标准偏差进行归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110317990.1/1.html,转载请声明来源钻瓜专利网。