[发明专利]一种单目深度估计方法、装置、电子设备及存储介质有效
| 申请号: | 201910486072.4 | 申请日: | 2019-06-05 |
| 公开(公告)号: | CN110264505B | 公开(公告)日: | 2021-07-30 |
| 发明(设计)人: | 张渊;安世杰 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06T7/50 | 分类号: | G06T7/50 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;丁芸 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 深度 估计 方法 装置 电子设备 存储 介质 | ||
1.一种单目深度估计方法,其特征在于,包括:
获取待估计深度的单目视频;
利用预先训练完成的深度估计模型,分别对所述单目视频中各个视频帧进行深度估计,得到各个所述视频帧的估计深度数据;
将各个所述视频帧的估计深度数据,确定为所述单目视频的单目深度估计结果;
其中,对训练中的所述深度估计模型的每一次训练过程包括:
获得多个预设样本帧、每个所述预设样本帧对应的对抗样本帧,以及多个标注深度数据,所述多个标注深度数据至少包括多个所述预设样本帧的标注深度数据;
分别将每个所述预设样本帧,以及每个所述对抗样本帧输入至训练中的所述深度估计模型,得到每个所述预设样本帧的估计深度数据和每个所述对抗样本帧的估计深度数据;
针对每个所述对抗样本帧,计算所述对抗样本帧的估计深度图中像素点的深度,与所对应预设样本帧的估计深度图中像素点的深度的目标误差,所述目标误差为均方根误差或均方误差;求取计算得到的各个目标误差的平均值,得到第一类损失值;
将每个所述标注深度图和所对应预设样本帧的估计深度图中,各像素点的深度输入至预设损失函数,计算第二类损失值;
基于所述第一类损失值和所述第二类损失值,判断训练中的所述深度估计模型是否收敛,如果收敛,结束训练,得到训练完成的所述深度估计模型;
所述对抗样本帧为:对所述预设样本帧进行数据增广处理得到的样本帧。
2.根据权利要求1所述的方法,其特征在于,对训练中的所述深度估计模型的每一次训练过程还包括:
如果未收敛,调整训练中的所述深度估计模型的模型参数,进入下一次训练。
3.根据权利要求1所述的方法,其特征在于,所述预设损失函数为一个预设函数或对多个预设函数进行加权求和后得到函数。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一类损失值和所述第二类损失值,判断训练中的所述深度估计模型是否收敛,包括:
将所述第一类损失值和所述第二类损失值进行加权求和,得到求和结果;判断所述求和结果是否小于预设损失值阈值,如果小于,判定训练中的所述深度估计模型收敛;否则,判定训练中的所述深度估计模型未收敛;
或者,
判断所述第一类损失值是否小于第一预设阈值,以及,判断所述第二类损失值是否小于第二预设阈值,如果均小于,判定训练中的所述深度估计模型收敛;否则,判定训练中的所述深度估计模型未收敛。
5.一种单目深度估计装置,其特征在于,包括:
获取模块,用于获取待估计深度的单目视频;
估计模块,用于利用预先训练完成的深度估计模型,分别对所述单目视频中各个视频帧进行深度估计,得到各个所述视频帧的估计深度数据;
确定模块,用于将各个所述视频帧的估计深度数据,确定为所述单目视频的单目深度估计结果;
其中,对训练中的所述深度估计模型的每一次训练过程包括:
获得多个预设样本帧、每个所述预设样本帧对应的对抗样本帧,以及多个标注深度数据,所述多个标注深度数据至少包括多个所述预设样本帧的标注深度数据;
分别将每个所述预设样本帧,以及每个所述对抗样本帧输入至训练中的所述深度估计模型,得到每个所述预设样本帧的估计深度数据和每个所述对抗样本帧的估计深度数据;
针对每个所述对抗样本帧,计算所述对抗样本帧的估计深度图中像素点的深度,与所对应预设样本帧的估计深度图中像素点的深度的目标误差,所述目标误差为均方根误差或均方误差;求取计算得到的各个目标误差的平均值,得到第一类损失值;
将每个所述标注深度图和所对应预设样本帧的估计深度图中,各像素点的深度输入至预设损失函数,计算第二类损失值;
基于所述第一类损失值和所述第二类损失值,判断训练中的所述深度估计模型是否收敛,如果收敛,结束训练,得到训练完成的所述深度估计模型;
所述对抗样本帧为:对所述预设样本帧进行数据增广处理得到的样本帧。
6.根据权利要求5所述的装置,其特征在于,对训练中的所述深度估计模型的每一次训练过程还包括:
如果未收敛,调整训练中的所述深度估计模型的模型参数,进入下一次训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910486072.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于增强现实的三维配准方法和系统
- 下一篇:基于空间编码的成像方法及装置





