[发明专利]基于改进Mask R-CNN的自动驾驶目标识别方法在审

专利信息
申请号: 202110287700.3 申请日: 2021-03-17
公开(公告)号: CN113111722A 公开(公告)日: 2021-07-13
发明(设计)人: 董恩增;杨启娟;佟吉钢;冯进峰;张祖锋;于航 申请(专利权)人: 天津理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34;G06K9/32;G06K9/62;G06N3/04
代理公司: 合肥晨创知识产权代理事务所(普通合伙) 34162 代理人: 康培培
地址: 300384 *** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 改进 mask cnn 自动 驾驶 目标 识别 方法
【权利要求书】:

1.基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,包括如下步骤,

S1、读取图片信息后对其进行预处理,得到图片的特征图;

S2、将特征图输入到区域推荐网络模块,得到推荐框;

S3、推荐框通过二分类层判断内部是否存在目标,然后区分推荐框中的目标和背景,利用边界回归确定目标位置,从筛选出的特征图确定ROI区域,再利用非极大值抑制NMS算法去除多余的推荐框得到精确的推荐框;

S4、对ROI区域进行处理后,掩码模块利用FCN网络对每个ROI区域进行分割,输出特征图;

S5、分类和边框回归模块收集得到ROI区域,ROI区域在此模块中计算分类损失和基于Kullback-Leibler loss边界框回归损失,利用NMS方法确定精确的推荐框,实现图片中目标的识别和分割。

2.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述步骤S1具体是首先对图片进行放缩处理,然后将其输入到特征提取网络模块的残差网络101+特征金字塔特征提取网络,再经过全卷积网络后,提取到图片的特征图。

3.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述步骤S2中区域推荐网络模块运用滑动窗遍历特征图,每个像素预测出多个锚框,产生推荐框。

4.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述滑动窗的大小为3*3。

5.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述每个像素预测的锚框尺寸有6种,6种尺度为{2,4,8,16,64,256},比例有9种{0.3:1,0.5:1,0.7:1,0.9:1,1:1,1.5:1,2:1,2.5:1,3:1},共54个锚框。

6.如权利要求3所述的基于改进Mask R-CNN的自动驾驶目标识别方法,

其特征在于,所述锚框基准窗设置为16*16,因此锚框的面积Sk如下,

Sk=(16*2k)K∈[1,6] (1)

锚框的长宽比为a:1,则每个锚框的宽WK、长HK如下,

7.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,

其特征在于,所述步骤S3中NMS算法的阈值筛选法公式如下,

式中,B={b1,b2,L L bn}是一系列初始的检验框,S={s1,s2,.....sn}是它们对应的分类得分,Nt是重叠度的阈值。

8.如权利要求1所述的基于改进Mask R-CNN的自动驾驶目标识别方法,其特征在于,所述步骤S4中对ROI区域进行处理具体是对ROI区域进行双线性插值对齐操作,将其尺寸固定成统一大小。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110287700.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top