[发明专利]基于改进Mask R-CNN的自动驾驶目标识别方法在审
申请号: | 202110287700.3 | 申请日: | 2021-03-17 |
公开(公告)号: | CN113111722A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 董恩增;杨启娟;佟吉钢;冯进峰;张祖锋;于航 | 申请(专利权)人: | 天津理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 合肥晨创知识产权代理事务所(普通合伙) 34162 | 代理人: | 康培培 |
地址: | 300384 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 mask cnn 自动 驾驶 目标 识别 方法 | ||
1.基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,包括如下步骤,
S1、读取图片信息后对其进行预处理,得到图片的特征图;
S2、将特征图输入到区域推荐网络模块,得到推荐框;
S3、推荐框通过二分类层判断内部是否存在目标,然后区分推荐框中的目标和背景,利用边界回归确定目标位置,从筛选出的特征图确定ROI区域,再利用非极大值抑制NMS算法去除多余的推荐框得到精确的推荐框;
S4、对ROI区域进行处理后,掩码模块利用FCN网络对每个ROI区域进行分割,输出特征图;
S5、分类和边框回归模块收集得到ROI区域,ROI区域在此模块中计算分类损失和基于Kullback-Leibler loss边界框回归损失,利用NMS方法确定精确的推荐框,实现图片中目标的识别和分割。
2.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述步骤S1具体是首先对图片进行放缩处理,然后将其输入到特征提取网络模块的残差网络101+特征金字塔特征提取网络,再经过全卷积网络后,提取到图片的特征图。
3.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述步骤S2中区域推荐网络模块运用滑动窗遍历特征图,每个像素预测出多个锚框,产生推荐框。
4.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述滑动窗的大小为3*3。
5.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述每个像素预测的锚框尺寸有6种,6种尺度为{2,4,8,16,64,256},比例有9种{0.3:1,0.5:1,0.7:1,0.9:1,1:1,1.5:1,2:1,2.5:1,3:1},共54个锚框。
6.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法,
其特征在于,所述锚框基准窗设置为16*16,因此锚框的面积Sk如下,
Sk=(16*2k)K∈[1,6] (1)
锚框的长宽比为a:1,则每个锚框的宽WK、长HK如下,
7.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,
其特征在于,所述步骤S3中NMS算法的阈值筛选法公式如下,
式中,B={b1,b2,L L bn}是一系列初始的检验框,S={s1,s2,.....sn}是它们对应的分类得分,Nt是重叠度的阈值。
8.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述步骤S4中对ROI区域进行处理具体是对ROI区域进行双线性插值对齐操作,将其尺寸固定成统一大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287700.3/1.html,转载请声明来源钻瓜专利网。