[发明专利]一种单目视频的深度估计方法、装置、终端和存储介质有效
申请号: | 201810514950.4 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108765481B | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 亮风台(上海)信息科技有限公司 |
主分类号: | G06T7/55 | 分类号: | G06T7/55 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 201203 上海市浦东新区中国(上海)*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目视 深度 估计 方法 装置 终端 存储 介质 | ||
1.一种单目视频的深度估计方法,其特征在于,包括:
获取单目视频的图像帧序列,并根据相机姿态估计算法,计算所述序列中相邻两张图像帧之间的姿态关系;
依次将所述序列中的各图像帧作为预设神经网络模型的输入,并根据所述预设神经网络模型的输出确定各所述图像帧的初始深度图和初始不确定度分布图;
根据各所述姿态关系以及各所述图像帧的初始深度图和初始不确定度分布图进行帧间信息传递和融合,依次确定各所述图像帧的最终深度图和最终不确定度分布图;
在使用所述预设神经网络模型之前,还包括:
建立预设神经网络子模型,并获取训练样本数据;
根据所述训练样本数据和网络子模型损失函数对所述预设神经网络子模型进行训练,其中,所述预设神经网络子模型的输出为初始深度图和初始置信度分布图;
于所述预设神经网络子模型训练结束后,根据输出转化关系,对所述预设神经网络子模型输出的初始置信度分布图进行转化,确定与所述初始置信度分布图对应的初始不确定度分布图,并将转化后的预设神经网络子模型确定为预设神经网络模型;
所述网络子模型损失函数根据如下公式确定:
l=αlD+βlU(0<α<1;0<β<1) (1)
lD=∑x∈X|d(x)-dgt(x)| (2)
lU=lc+lr (3)
lr=∑x∈Xγ|c(x)|(0<γ<1) (4)
lc=∑x∈X|c(x)-cgt(x)| (5)
其中,l是所述网络子模型损失函数,lD是深度损失函数,lU是利用置信度表示的不确定度损失函数,x是图像帧中的任一像素点,X是图像帧中所有像素点的集合,d(x)是根据所述预设神经网络子模型的输出确定的像素点x对应的输出深度值,dgt(x)是像素点x的实际深度值,lc是置信度损失函数,lr是用于控制c(x)收敛速度的惩罚系数,c(x)是根据所述预设神经网络子模型的输出确定的像素点x对应的输出置信度,cgt(x)是像素点x的实际置信度,α是所述深度损失函数的权重系数,β是所述不确定度损失函数的权重系数、γ是所述输出置信度c(x)的权重系数。
2.根据权利要求1所述的方法,其特征在于,根据各所述姿态关系以及各所述图像帧的初始深度图和初始不确定度分布图进行帧间信息传递和融合,依次确定各所述图像帧的最终深度图和最终不确定度分布图,包括:
根据当前图像帧与前一图像帧之间的姿态关系以及所述前一图像帧的最终深度图和最终不确定度分布图,计算所述当前图像帧的传递深度图和传递不确定度分布图;
根据预设融合方式,将所述当前图像帧的初始深度图和初始不确定度分布图以及所述传递深度图和传递不确定度分布图进行融合,确定所述当前图像帧的最终深度图和最终不确定度分布图。
3.根据权利要求2所述的方法,其特征在于,根据当前图像帧与前一图像帧之间的姿态关系以及所述前一图像帧的最终深度图和最终不确定度分布图,计算所述当前图像帧的传递深度图和传递不确定度分布图,包括:
将前一图像帧中的所有像素点逐个作为目标像素点,根据所述前一图像帧的最终深度图和最终不确定度分布图,确定所述目标像素点对应的目标深度值和目标不确定度;
根据相机参数和所述目标像素点的第一像素坐标以及所述目标深度值确定所述目标像素点对应的三维空间点的第一空间坐标;
根据所述前一图像帧与当前图像帧之间的姿态关系、所述第一空间坐标和所述相机参数确定所述三维空间点在当前图像帧上的投影像素点的第二像素坐标以及所述投影像素点对应的传递深度值;
根据所述目标不确定度确定所述投影像素点对应的传递不确定度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亮风台(上海)信息科技有限公司,未经亮风台(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810514950.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:深度处理设备
- 下一篇:一种基于硬件加速的低功耗实时双目摄像头及使用方法