[发明专利]一种端到端的车辆位姿检测方法及装置在审
申请号: | 202111299196.5 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114067282A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 王闪闪;班华忠;王正;崔凯 | 申请(专利权)人: | 北京智芯原动科技有限公司 |
主分类号: | G06V20/54 | 分类号: | G06V20/54;G06V10/25;G06V10/46;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06T7/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端到端 车辆 检测 方法 装置 | ||
1.一种端到端的车辆位姿检测方法,其特征在于,该方法包括:
第一步骤,搜集车辆样本图像,对车辆样本图像内的车辆矩形框位置和车辆底盘的3个关键点进行标定,获取标定的车辆样本图像;对标定的车辆样本进行图像预处理,获取预处理后的车辆样本;
第二步骤,建立由主干网络、车检分支网络、车姿检测分支网络组成的车辆位姿检测网络;
第三步骤,将预处理后的车辆样本输入车辆位姿检测网络,进行反复训练,直至网络收敛,获得训练好的车辆位姿检测网络;
第四步骤,将待检测图像输入到训练好的车辆位姿检测网络,进行检测后,输出待检测图像中的车检定位信息、车辆置信度、车辆底盘的3个关键点和车辆方向;
其中,所述车辆样本图像内的车辆矩形框位置为图像中车辆检测的矩形框;
其中,车辆矩形框内有4个车辆位置坐标,其中车头方向的2个位置坐标,按照左、右顺序,记为车头左端点、车头右端点;车尾方向的2个位置坐标,按照左、右顺序,车尾左端点、车尾右端点;所述车辆底盘的3个关键点分别是:车头或者车尾的两个端点、车辆可见侧边的端点;
其中,所述第二步骤中图像输入到主干网络,经过主干网络处理后,获得多尺寸维度下的图像特征,将多尺寸维度下的图像特征输出给车检分支网络和车姿检测分支网络;
所述车检分支网络包括车检分支特征网络和车检分支网络头,其中车检分支特征网络用于接收主干网络输出的多尺寸维度下的图像特征,进行特征细化及融合处理后,输出给车检分支网络头的进行处理,最终输出检测图像中的车辆定位信息、车辆置信度、车辆中心度;
所述车姿检测分支网络包括车姿检测分支特征金字塔网络和车姿检测分支网络头,所述车姿检测分支特征金字塔网络采用特征金字塔网络,从多尺寸维度下的图像特征中,提取与车辆姿态相关的语义信息;所述车姿检测分支网络头由4组CONV+RELU的卷积模块级联而成,所述车姿检测分支网络头的卷积模块输出车姿的关键点分支和方向分支,其中关键点分支是输出通道为6的卷积层,关键点分支的6个输出通道的数值分别表示车辆底盘的3个关键点的水平坐标和垂直坐标;方向分支是输出通道为1的卷积层,方向分支的1个输出通道的数值表示目标车辆的方向;
其中,所述主干网络采用轻量级网络结构;车辆定位信息包括车辆的车辆矩形框的左上端点和右下端点的位置坐标;车辆中心度表示anchor点与中心点的偏离度,取值在0~1之间;所述目标车辆的方向包括:车头超前、车尾超前。
2.如权利要求1所述的方法,其特征在于,所述车辆底盘的3个关键点包括:当车辆的车头在车尾下方时,如果车辆向右倾斜,则选择车头左端点、车头右端点、车尾右端点作为车辆底盘的3个关键点;当车辆的车头在车尾下方时,如果车辆向左倾斜,则选择头左端点、车头右端点、车尾左端点作为车辆底盘的3个关键点;当车辆的车尾在车头下方时,如果车辆向右倾斜,则选择车尾左端点、车尾右端点、车头右端点作为车辆底盘的3个关键点;当车辆的车尾在车头下方时,如果车辆向左倾斜,则选择车尾左端点、车尾右端点、车头左端点作为车辆底盘的3个关键点。
3.如权利要求1所述的方法,其特征在于,所述图像预处理包括以下一种或者多种的组合:图像亮度调节、图像角度校正、选定目标随机擦除处理;
进一步地,所述选定目标随机擦除处理步骤包括:对于目标a和目标b,如果目标b的矩形框下边界大于目标a的矩形框下边界,计算目标a与目标b的交并比,将计算的交并比作为目标a的被遮挡率;如果目标a的被遮挡率小于遮挡阈值,则对目标a采用随机擦除方法,擦除遮挡目标a的部分区域,如果目标的被遮挡率不小于遮挡阈值,则不对目标a进行擦除处理;
其中,所述遮挡阈值的取值范围为0.05~0.5。
4.如权利要求3所述的方法,其特征在于,所述主干网络采用YOLOV5S网络结构,将所述YOLOV5S网络结构中的Focus模块修改为CONV+BN+RELU的卷积模块,其中CONV表示卷积层,BN表示归一化层,RELU表示激活函数。
5.如权利要求1所述的方法,其特征在于,所述车姿检测分支网络头的卷积模块的卷积核设置为3*3或者1*1,通道数设计设置为32或者64或者128或者256,同时不同特征层之间不共享权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智芯原动科技有限公司,未经北京智芯原动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111299196.5/1.html,转载请声明来源钻瓜专利网。