[发明专利]一种无监督的运动物体的单目深度估计方法及系统在审
申请号: | 202210231897.3 | 申请日: | 2022-03-09 |
公开(公告)号: | CN114820719A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 范博文 | 申请(专利权)人: | 广州宸祺出行科技有限公司 |
主分类号: | G06T7/269 | 分类号: | G06T7/269;G06T7/50 |
代理公司: | 广州云领专利代理事务所(普通合伙) 44441 | 代理人: | 肖云 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 监督 运动 物体 深度 估计 方法 系统 | ||
本发明公开了一种无监督的运动物体的单目深度估计方法及系统,其中方法包括:获取来自单目摄像头的帧序列数据;提取帧序列数据的中间帧作为参考帧;基于帧序列数据获取运动前景数据和运动光流数据;将运动前景数据输入到深度估计模块,以得到深度序列数据;将运动前景数据输入到相机超参估计模块,以得到相机超参数值;基于损失函数对运动光流数据、深度序列数据和相机超参数值进行计算,以获取运动物体的运动检测数据和深度估计数据。通过从帧序列中提取参考帧,通过帧序列数据获取运动前景数据和运动光流数据,进而获得深度序列数据和相机超参数值,最后综合计算获得单目深度估计数据,实现了以简洁的系统实现准确的单目深度估计的效果。
技术领域
本发明涉及自动驾驶的单目深度估计技术的领域,具体涉及一种无监督的运动物体的单目深度估计方法及系统。
背景技术
自动驾驶作为当下出行行业最具潜力的技术,也是人工智能概念的主要应用场景,普及后必将极大地促进社会生产力发展,优化道路通行状况,提高通行安全性。自动驾驶的实现离不开计算机视觉技术的突破,作为最重要的感知方式,视觉技术需要识别道路、移动物体和周边场景,并返回其现实世界的立体坐标信息,其中对移动物体的识别和立体坐标信息的提取尤为困难。
对物体的立体识别的方法分为有监督和无监督。有监督是指视频、图片有人为设定的标签,优点是完全符合人的认识,但由于真实世界里的移动物体类型千变万化,有监督意味着需要投入无数的人力用于标注数据,这是产业应用不能承受的。因此,对不依赖人为标注即无监督视觉识别技术的发展被视为人工智能领域的最重要突破口。当前,对移动物体的视觉深度估计方法根据摄像头数量分为双目、多目和单目,相比于前两种方法,单目视觉缺乏空间信息,是最难实现的。但是单目视觉由于使用方便、成本较低,最接近实际应用场景而具有很高的研究收益。
现有技术中的无监督单目深度估计的方法一般是将连续的图片序列作为输入,输出预测深度,此种方法在有大量移动目标影响下,精度会受影响,且依赖于摄像头参数标定,导致处理流程较为复杂,影响深度估计的处理效率。
发明内容
为了克服上述现有的无监督单目深度估计方法中,不适用于大量移动目标,依赖摄像头参数标定且处理流程复杂技术缺陷,本发明提供一种无监督的运动物体的单目深度估计方法及系统。
为了解决上述问题,本发明按以下技术方案予以实现的:
第一方面,本发明公开一种无监督的运动物体的单目深度估计方法,具体包括以下步骤:
获取来自单目摄像头的帧序列数据;
提取帧序列数据的中间帧作为参考帧;
基于帧序列数据获取运动前景数据和运动光流数据;
将运动前景数据输入到深度估计模块,以得到深度序列数据;
将运动前景数据输入到相机超参估计模块,以得到相机超参数值;
基于损失函数对运动光流数据、深度序列数据和相机超参数值进行计算,以获取运动物体的运动检测数据和深度估计数据。
作为针对第一方面的第1种优选实施方式,所述基于帧序列数据获取运动前景数据和运动光流数据,具体包括:
将帧序列数据输送至光流模块,经过处理后获得光流序列数据;
将光流序列数据输送至运动检测模块,经过处理后获得运动掩膜序列数据;
将帧序列数据与运动掩膜序列数据进行对应相乘后,获得运动前景数据;
将光流序列数据与运动掩膜序列数据对应相乘后,获得运动光流数据。
作为针对第一方面的第2种优选实施方式,所述基于损失函数对运动光流数据、深度序列数据和相机超参数值进行计算,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州宸祺出行科技有限公司,未经广州宸祺出行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210231897.3/2.html,转载请声明来源钻瓜专利网。