[发明专利]一种基于深度估计的单目视觉前向车辆距离检测方法有效
申请号: | 202110633046.7 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113269118B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵敏;孙棣华;周璇 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/44;G06V10/762;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 武君 |
地址: | 400000 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 估计 目视 车辆 距离 检测 方法 | ||
1.一种基于深度估计的单目视觉前向车辆距离检测方法,其特征在于:包括以下步骤:
S1、搭建基于深度估计的前向车辆距离检测模型;
前向车辆距离检测模型的结构分为三部分:输入、中间处理和输出,输入部分包括RGB原图、车辆目标框坐标和深度图,其中RGB原图是整个网络用于分析检测的输入值,深度图是网络用于与预测值进行对比、训练学习的真实值,车辆目标框坐标是用于最后显示车辆目标的输出图所需要的坐标;中间处理部分包括特征提取、池化、回归以及关键点拟合,关键点拟合是从预测到的深度图中获取目标关键点的信息;输出部分是一张带有车辆目标框和距离值的RGB图;
S2、引入DORN算法,搭建基于DORN的前向车辆距离检测模型;
S2.1引入DORN网络中的密集特征提取器模块作为特征提取网络,通过去除特征提取器DCNNs中的最后几个下采样算子,并在随后的卷积层中插入空格进行过滤,从而在不降低空间分辨率或增加参数量的基础上扩大滤波器的视野,形成扩张卷积;
S2.2引入场景理解模块,所述场景理解模块由三个并行的组件构成,一个空洞空间卷积池化金字塔(ASPP)模块、一个跨通道leaner以及一个fullimage全图像编码器;
S2.3引入序数回归模块,将离散深度值化分为多类,将回归问题转为分类问题,并在网络的最后采用了Softmax函数,用于回归损失值,实现网络训练;
S2.4车辆目标关键点拟合方法,选取以目标框长宽一半的坐标为阈值,取阈值内部的像素值的平均作为模型拟定的关键点距离值,其公式如下:
式中,w和h分别代表像素的横坐标和纵坐标,W和H则为目标框缩小后的阈值,N代表在阈值范围内包含像素的数量,由此拟合出目标距离值;
S3、优化目标关键点拟合方法;
S3.1引入k-means聚类算法,实现车辆目标关键点的拟合;通过对预测目标框里面的像素进行聚类,求出数量排行靠前的第一类别和第二类别,然后分析:当第一类别的数量大于第二类别的1.5倍时,如果第一类别中心点的距离值小于阈值80m,选取第一类别为最终类别,如果第一类别中心值大于阈值80m,则选取第二类别为最终类别;而当第一类别的数量和第二类别的数量相差没有1.5倍时,取中心点距离值小的作为最终类别,之后将最终类别的中心点作为目标的关键点,并选取目标关键点的距离值作为前向车辆目标距离的预测值;
S3.2通过参数配置,提升车辆目标关键点拟合的精度;
S4、设计网络训练中的损失函数;
S5、利用模型压缩加速工具,实现对前向车辆距离检测模型的加速。
2.如权利要求1所述的基于深度估计的单目视觉前向车辆距离检测方法,其特征在于:所述步骤S1,在中间处理部分中特征提取网络为卷积神经网络,采用VGG16或Resnet50作为特征提取网络。
3.如权利要求1所述的基于深度估计的单目视觉前向车辆距离检测方法,其特征在于:所述S4中包括:1)利用L1范数损失函数,设计目标关键点的回归损失函数;2)结合序数回归函数,实现网络训练回归。
4.如权利要求1所述的基于深度估计的单目视觉前向车辆距离检测方法,其特征在于:所述S5包括:1)将网络中无法直接转换的数据的输出转换成可操作的tensor形式;2)将前向车辆距离检测模型转化为TensorRT模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110633046.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴承防锈油涂抹装置
- 下一篇:一种隐藏式智能灭火消防水炮