[发明专利]一种无监督的运动物体的单目深度估计方法及系统在审
申请号: | 202210231897.3 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114820719A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 范博文 | 申请(专利权)人: | 广州宸祺出行科技有限公司 |
主分类号: | G06T7/269 | 分类号: | G06T7/269;G06T7/50 |
代理公司: | 广州云领专利代理事务所(普通合伙) 44441 | 代理人: | 肖云 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 运动 物体 深度 估计 方法 系统 | ||
1.一种无监督的运动物体的单目深度估计方法,其特征在于,具体包括以下步骤:
获取来自单目摄像头的帧序列数据;
提取帧序列数据的中间帧作为参考帧;
基于帧序列数据获取运动前景数据和运动光流数据;
将运动前景数据输入到深度估计模块,以得到深度序列数据;
将运动前景数据输入到相机超参估计模块,以得到相机超参数值;
基于损失函数对运动光流数据、深度序列数据和相机超参数值进行计算,以获取运动物体的运动检测数据和深度估计数据。
2.根据权利要求1所述的无监督的运动物体的单目深度估计方法,其特征在于,所述基于帧序列数据获取运动前景数据和运动光流数据,具体包括:
将帧序列数据输送至光流模块,经过处理后获得光流序列数据;
将光流序列数据输送至运动检测模块,经过处理后获得运动掩膜序列数据;
将帧序列数据与运动掩膜序列数据进行对应相乘后,获得运动前景数据;
将光流序列数据与运动掩膜序列数据对应相乘后,获得运动光流数据。
3.根据权利要求2所述的无监督的运动物体的单目深度估计方法,其特征在于,所述基于损失函数对运动光流数据、深度序列数据和相机超参数值进行计算,具体包括:
将运动光流数据、深度序列数据和相机超参数值分别输入到重构模块,重构后得到重构图片;
基于损失函数,对参考帧中的运动物体与重构图片进行计算,以获取运动物体的运动检测数据和深度估计数据。
4.根据权利要求3所述的无监督的运动物体的单目深度估计方法,其特征在于:
所述损失函数具体为:Loss=|I预测-ML//2*IL//2|2;
其中,所述I预测为重构图片,所述IL//2为参考帧,所述ML//2为参考运动掩膜,所述参考运动掩膜为运动掩膜序列数据的中间掩膜。
5.根据权利要求1所述的无监督的运动物体的单目深度估计方法,其特征在于,所述获取单目摄像头的帧序列数据,具体包括:
获取单目摄像头采集的带有运动物体的视频数据;
对视频数据进行解码;
获取预设长度信息;
在解码后的视频数据中截取符合预设长度的视频,以形成帧序列数据。
6.一种无监督的运动物体的单目深度估计系统,其特征在于,包括:
数据获取模块,其用于获取来自单目摄像头的帧序列数据;
数据提取模块,其用于提取帧序列数据的中间帧作为参考帧;
数据处理模块,其用于基于帧序列数据获取运动前景数据和运动光流数据;
深度估计模块,其用于将运动前景数据输入到深度估计模块,以得到深度序列数据;
超参估计模块,其用于将运动前景数据输入到相机超参估计模块,以得到相机超参数值;
综合计算模块,其用于基于损失函数对运动光流数据、深度序列数据和相机超参数值进行计算,以获取运动物体的运动检测数据和深度估计数据。
7.根据权利要求6所述的无监督的运动物体的单目深度估计系统,其特征在于,所述数据处理模块具体包括:
光流数据单元,其用于将帧序列数据输送至光流模块,经过处理后获得光流序列数据;
运动检测单元,其用于将光流序列数据输送至运动检测模块,经过处理后获得运动掩膜序列数据;
运动前景单元,其用于将帧序列数据与运动掩膜序列数据进行对应相乘后,获得运动前景数据;
运动光流单元,其用于将光流序列数据与运动掩膜序列数据对应相乘后,获得运动光流数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州宸祺出行科技有限公司,未经广州宸祺出行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210231897.3/1.html,转载请声明来源钻瓜专利网。