[发明专利]基于改进Mask R-CNN的自动驾驶目标识别方法在审

专利信息
申请号: 202110287700.3 申请日: 2021-03-17
公开(公告)号: CN113111722A 公开(公告)日: 2021-07-13
发明(设计)人: 董恩增;杨启娟;佟吉钢;冯进峰;张祖锋;于航 申请(专利权)人: 天津理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34;G06K9/32;G06K9/62;G06N3/04
代理公司: 合肥晨创知识产权代理事务所(普通合伙) 34162 代理人: 康培培
地址: 300384 *** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 改进 mask cnn 自动 驾驶 目标 识别 方法
【说明书】:

发明属于机器视觉技术领域,涉及基于改进Mask R‑CNN的自动驾驶目标识别方法。该方法包括如下步骤,S1、读取图片信息后对其进行预处理,得到图片的特征图;S2、将特征图输入到区域推荐网络模块,得到推荐框;S3、推荐框通过二分类层判断内部是否存在目标,然后区分推荐框中的目标和背景,利用边界回归确定目标位置,从筛选出的特征图确定ROI区域,再利用非极大值抑制NMS算法去除多余的推荐框得到精确的推荐框;S4、对ROI区域进行处理后,掩码模块利用FCN网络对每个ROI区域进行分割,输出特征图;S5、分类和边框回归模块收集得到ROI区域,ROI区域在此模块中计算分类损失和基于Kullback‑Leibler loss边界框回归损失,利用NMS方法确定精确的推荐框,实现图片中目标的识别和分割。

技术领域

本发明属于机器视觉技术领域,更具体地,涉及基于改进Mask R-CNN的自动驾驶目标识别方法。

背景技术

汽车自动驾驶技术始于Google的无人驾驶汽车项目,近些年随着深度学习在图像处理中的不断应用,自动驾驶相应得到了快速发展,这使得基于深度学习的道路环境感知方法在自动驾驶中的应用成为可能。然而在自动驾驶领域中,由于道路交通中路况比较复杂,车辆来往疏密不同,车速起伏也相对较大,这就导致对车辆及其周围环境的识别要求相对较高。在自动驾驶中最重要的是视觉感知,当天气状况恶劣,如雨雪、雾霾天气;道路状况复杂,人群车辆往来较密时,这些复杂路况对视觉感知算法仍是一个挑战。

研究表明,基于Mask R-CNN的图像分割方法相比较于其它基于深度学习的图像分割方法如SDS、CFM、MNC等可以实现同一类别中不同个体的检测分割,且在分割准确率方面有了极大的提升。Mask R-CNN是基于CNN(convolutional neural network,卷积神经网络)的目标识别及分割算法的主流框架之一,采用ResNet-101+FPN特征提取网络输入图片进行特征提取,然后对Feature maps上的每个像素点都预测9个anchor boxes再挑选出分类得分高的300个anchor boxes作为最终的ROI区域。最后将ROI区域送入Mask模块、Classification和Boundingbox regression模块判定目标类别并获得精准的目标位置。Mask R-CNN是一种比较接近人类真实视觉感受的计算机视觉算法,在自动驾驶领域有着很高的应用价值。但Mask R-CNN算法存在由于目标边界框模糊导致边缘分割效果不佳以及对小目标的分割效果较差的缺点。

发明内容

针对现有技术存在的不足之处,本发明提出基于改进Mask R-CNN的自动驾驶目标识别方法。该方法通过对Mask R-CNN算法的改进,能够很好地应对复杂多变的交通环境,准确检测分割车辆及其周围的路况,该改进方法在自动驾驶应用中具有良好的适用性。

各类大中小目标的自动检测分割与识别是自动驾驶视觉感知的关键技术,尤其是对来往车辆以及行人。针对比较复杂的道路交通路况,变化的车速对目标分割和识别的高精度要求,本发明提出了基于KL loss的改进Mask R-CNN算法。采用ResNet-101+FPN特征提取网络,实现更好的Feature maps,充分利用提取到的各个阶段的特征;采用估计位置置信度的网络结构KL loss对边界框进行回归,极大地提升由于边界框的模糊而影响边界的分割精确度,且几乎不会增加额外的计算成本。为完善算法在雨雪等恶劣天气中的目标检测分割效果,结合自动驾驶数据集Cityscapes中的8000个图片和MS-COCO数据集中的1942个图片对模型进行训练。实验结果表明该发明算法与Mask R-CNN相比,在分割精度和召回上均有明显提升,在自动驾驶场景中具有良好的泛化能力和实用性。

为实现上述目的,本发明采用如下技术方案:

基于改进Mask R-CNN的自动驾驶目标识别方法,包括如下步骤,

S1、读取图片信息后对其进行预处理,得到图片的特征图;

S2、将特征图输入到区域推荐网络模块,得到推荐框;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津理工大学,未经天津理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110287700.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top