[发明专利]图像深度信息单目估计方法、设备及可读存储介质在审
| 申请号: | 202110554113.6 | 申请日: | 2021-05-20 |
| 公开(公告)号: | CN113192149A | 公开(公告)日: | 2021-07-30 |
| 发明(设计)人: | 王飞;许强;郭宇;张秋光;张雪涛 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06T9/00 | 分类号: | G06T9/00;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 房鑫 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 深度 信息 估计 方法 设备 可读 存储 介质 | ||
1.一种图像深度信息单目估计方法,其特征在于,包括以下步骤:
将待估计图像作为预训练好的自监督通道混合网络的输入;其中,自监督通道混合网络包括编码器模块、通道混合模块CSM及解码器模块;
利用编码器模块对待估计图像进行编码,得到若干不同层次的语义特征图;其中,若干语义特征图的语义层次不同,且分辨率不同;
利用通道混合模块CSM将若干不同层次语义特征图在通道方向进行混合、分散,得到不同分辨率的融合特征;
利用解码器模块分别对不同分辨率的融合特征进行解码,得到对应分辨率的深度估计,即得到待估计图像的深度图像。
2.根据权利要求1所述的一种图像深度信息单目估计方法,其特征在于,编码器模块采用多尺度特征编码器GEnc;其中,多尺度特征编码器GEnc为基于Resnet18网络的编码器;多尺度特征编码器GEnc包括卷积层conv1、编码器第一层layer1、编码器第二层layer2、编码器第三层layer3及编码器第四层layer4;
多尺度特征编码器GEnc的输入为RGB图像,输出为语义特征图R-Conv-1、语义特征图R-Conv-2、语义特征图R-Conv-3、语义特征图R-Conv-4及语义特征图R-Conv-5;
其中,语义特征图R-Conv-1、语义特征图R-Conv-2、语义特征图R-Conv-3、语义特征图R-Conv-4及语义特征图R-Conv-5的分辨率依次降低。
3.根据权利要求2所述的一种图像深度信息单目估计方法,其特征在于,利用通道混合模块CSM,将若干不同层次语义特征图在通道方向进行混合、分散,得到不同分辨率的融合特征的过程,具体如下:
对语义特征图R-Conv-1、语义特征图R-Conv-2、语义特征图R-Conv-3、语义特征图R-Conv-4及语义特征图R-Conv-5分别进行卷积操作,得到语义特征图Conv-1、语义特征图Conv-2、语义特征图Conv-3、语义特征图Conv-4及语义特征图Conv-5;其中,语义特征图Conv-1~5的通道数据相同;
对语义特征图Conv-2、语义特征图Conv-3、语义特征图Conv-4及语义特征图Conv-5分别进行上采样操作,使上采样后的语义特征图Conv-2~5的分辨率与语义特征图Conv-1的分辨率相同;
将语义特征图Conv-1与上采样后的语义特征图Conv-2~5进行合并操作,之后进行通道混合操作,得到混合语义特征;
在通道方向上,对混合语义特征进行均匀分割操作,得到五层通道数相同的语义特征;
保持第一层语义特征的分辨率不变,记为语义特征图C-Conv-1;
对第二层语义特征至第五层语义特征分别进行降采样操作,使降采样操作后的语义特征的分辨率分别与语义特征图Conv-2、语义特征图Conv-3、语义特征图Conv-4及语义特征图Conv-5的分辨率对应相同,得到语义特征图C-Conv-2、语义特征图C-Conv-3、语义特征图C-Conv-4及语义特征图C-Conv-5;
对语义特征图C-Conv-1~5分别进行卷积操作,得到语义特征图S-Conv-1、语义特征图S-Conv-2、语义特征图S-Conv-3、语义特征图S-Conv-4及语义特征图S-Conv-5;
将语义特征图Conv-1~5与语义特征图S-Conv-1~5分布对应合并,得到不同分辨率的融合特征。
4.根据权利要求3所述的一种图像深度信息单目估计方法,其特征在于,合并操作采用concat函数;分割操作采用Split函数;上采样操作采用nearest上采样,降采样操作采用nearest降采样。
5.根据权利要求1所述的一种图像深度信息单目估计方法,其特征在于,解码器模块采用深度神经网络解码器;其中,深度神经网络解码器包括卷积块、上采样层、合并层、卷积层及输出层;
卷积块的输入为不同分辨率的融合特征;卷积块的输出与上采样层的输入相连,上采样层的输出与合并层的输入相连,合并层的输出与卷积层的输入相连,卷积层的输出与输出层的输入相连。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110554113.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





