[发明专利]基于改进Mask R-CNN的自动驾驶目标识别方法在审

申请号：	202110287700.3	申请日：	2021-03-17
公开（公告）号：	CN113111722A	公开（公告）日：	2021-07-13
发明（设计）人：	董恩增;杨启娟;佟吉钢;冯进峰;张祖锋;于航	申请（专利权）人：	天津理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/32;G06K9/62;G06N3/04
代理公司：	合肥晨创知识产权代理事务所(普通合伙) 34162	代理人：	康培培
地址：	300384 ***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于改进 mask cnn 自动驾驶目标识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于改进Mask R-CNN的自动驾驶目标识别方法，其特征在于，包括如下步骤，

S1、读取图片信息后对其进行预处理，得到图片的特征图；

S2、将特征图输入到区域推荐网络模块，得到推荐框；

S3、推荐框通过二分类层判断内部是否存在目标，然后区分推荐框中的目标和背景，利用边界回归确定目标位置，从筛选出的特征图确定ROI区域，再利用非极大值抑制NMS算法去除多余的推荐框得到精确的推荐框；

S4、对ROI区域进行处理后，掩码模块利用FCN网络对每个ROI区域进行分割，输出特征图；

S5、分类和边框回归模块收集得到ROI区域，ROI区域在此模块中计算分类损失和基于Kullback-Leibler loss边界框回归损失，利用NMS方法确定精确的推荐框，实现图片中目标的识别和分割。

2.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法，其特征在于，所述步骤S1具体是首先对图片进行放缩处理，然后将其输入到特征提取网络模块的残差网络101+特征金字塔特征提取网络，再经过全卷积网络后，提取到图片的特征图。

3.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法，其特征在于，所述步骤S2中区域推荐网络模块运用滑动窗遍历特征图，每个像素预测出多个锚框，产生推荐框。

4.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法，其特征在于，所述滑动窗的大小为3*3。

5.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法，其特征在于，所述每个像素预测的锚框尺寸有6种，6种尺度为{2,4,8,16,64,256}，比例有9种{0.3:1，0.5:1，0.7:1，0.9:1，1:1，1.5:1，2:1，2.5:1，3:1}，共54个锚框。

6.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法，

其特征在于，所述锚框基准窗设置为16*16，因此锚框的面积S_k如下，

S_k＝(16*2^k)K∈[1,6] (1)

锚框的长宽比为a:1,则每个锚框的宽W_K、长H_K如下，

7.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法，

其特征在于，所述步骤S3中NMS算法的阈值筛选法公式如下，

式中，B＝{b₁,b₂,L L b_n}是一系列初始的检验框，S＝{s₁,s₂,.....s_n}是它们对应的分类得分，N_t是重叠度的阈值。

8.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法，其特征在于，所述步骤S4中对ROI区域进行处理具体是对ROI区域进行双线性插值对齐操作，将其尺寸固定成统一大小。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津理工大学，未经天津理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110287700.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载