[发明专利]利用卷积空间传播网络学习的亲和度进行深度估计的系统和方法有效
申请号: | 201880058392.3 | 申请日: | 2018-06-29 |
公开(公告)号: | CN111066063B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 王鹏;程新景;杨睿刚 | 申请(专利权)人: | 百度时代网络技术(北京)有限公司;百度(美国)有限责任公司 |
主分类号: | G06T7/50 | 分类号: | G06T7/50 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
地址: | 100080 北京市海淀区东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 卷积 空间 传播 网络 学习 亲和 进行 深度 估计 系统 方法 | ||
1.一种用于端对端训练模型以从单个图像估计深度的方法,所述方法包括:
在卷积空间传播网络处接收亲和矩阵和初始深度图,所述初始深度图包括与图像中的结构相关联的像素深度;
通过所述卷积空间传播网络使用所述亲和矩阵和所述初始深度图以在多个方向上传播局部区域,同时并行地递归地更新每个像素深度,以针对细化深度图中的一组边界,改进与所述图像中的所述结构的一组边界的对准;
在所述卷积空间传播网络的最终层处输出所述细化深度图;
计算误差;
执行反向传播;以及
迭代,直到达到停止条件为止。
2.根据权利要求1所述的方法,还包括将所述图像输入至第一卷积神经网络中以输出所述初始深度图。
3.根据权利要求2所述的方法,其中,所述传播局部区域的操作通过所述卷积空间传播网络来学习扩散张量。
4.根据权利要求3所述的方法,其中,所述卷积空间传播网络使用传播模型并且使用递归卷积操作来获得长范围环境,所述传播模型是各向异性扩散过程。
5.根据权利要求2所述的方法,还包括通过将来自编码器的特征直接级联至向上投影层来向所述第一卷积神经网络添加镜像连接。
6.根据权利要求3所述的方法,还包括将对应于与稀疏像素集合相关联的ground-truth深度值的稀疏深度值输入至所述第一卷积神经网络中,以及将所述稀疏深度值与所述图像的数据相结合以输出所述初始深度图。
7.根据权利要求6所述的方法,其中,所述卷积空间传播网络响应于接收到所述稀疏深度值而生成所述细化深度图。
8.根据权利要求6所述的方法,其中,通过递归网络进行的卷积减少了周围像素的深度梯度误差,从而降低当用稀疏深度值置换所述细化深度图中的值时不连续的可能性。
9.根据权利要求6所述的方法,其中,所述ground-truth深度值已由光探测和测距系统以及线性激光传感器系统中的一个通过测量获得。
10.根据权利要求1所述的方法,其中,由接收所述图像并且包括被学习的参数的第二卷积神经网络生成所述亲和矩阵。
11.根据权利要求1所述的方法,其中,所述传播局部区域的过程包括通过深度卷积神经网络从所述图像的数据来学习扩散张量。
12.一种用于从单个图像估计深度的方法,所述方法包括:
将图像输入至已通过使用卷积空间传播网络进行端对端训练的模型中,所述卷积空间传播网络通过在多个方向上传播局部区域且同时并行地递归地更新每个像素深度而将初始深度图转换成细化深度图,所述初始深度图包括与图像中的结构相关联的像素深度;以及
使用所述细化深度图以从所述图像估计像素深度。
13.根据权利要求12所述的方法,其中,所述卷积空间传播网络接收稀疏深度样本并且使用所述稀疏深度样本来生成所述细化深度图。
14.根据权利要求13所述的方法,其中,所述稀疏深度样本的值保留在所述细化深度图中。
15.根据权利要求12所述的方法,其中,所估计的像素深度表示结构与相机之间的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度时代网络技术(北京)有限公司;百度(美国)有限责任公司,未经百度时代网络技术(北京)有限公司;百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880058392.3/1.html,转载请声明来源钻瓜专利网。