[发明专利]一种基于深度学习的道路不规则区域检测网络有效
| 申请号: | 201911372843.3 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111160230B | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 张翠翠;孙辉;陈小琴 | 申请(专利权)人: | 清华大学苏州汽车研究院(吴江) |
| 主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V20/58;G06V20/70;G06V10/25;G06V10/26;G06V10/774;G06V10/82 |
| 代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 范晴 |
| 地址: | 215200 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 道路 不规则 区域 检测 网络 | ||
1.一种基于深度学习的道路不规则区域检测网络,其特征在于:包括编码部分和解码部分,所述编码部分采用FPN作为主干网络,主干网络中卷积操作采用可变性卷积以适应不规则目标的结构,并设计Deformable OctConv对目标的高低频进行分解,还设计DOSEnet结构实现自动监督的注意力机制,提升关键目标的学习权重;所述解码部分分为三个分支,分别为前景分支、背景分支和区域候选网络分支,采用DUp sample结构。
2.如权利要求1所述的基于深度学习的道路不规则区域检测网络,其特征在于:编码部分的FPN主干网络中的卷积采用的可变性卷积,根据目标的形状在训练过程中自行的调整卷积核。
3.如权利要求2所述的基于深度学习的道路不规则区域检测网络,其特征在于:所述Deformable Oct Conv是把OctConv中传统卷积核计算方式替换为Deformable卷积核带偏置计算,以适应目标轮廓,Deformable OctConv用来存储和处理不规则目标在较低空间分辨率下空间变化较慢的特征图,通过降低低频特征的分辨率,持续提高图像和视频识别不规则目标任务的精度。
4.如权利要求3所述的基于深度学习的道路不规则区域检测网络,其特征在于:所述Deformable OctConv将高频和低频特征映射存储到不同的组中,通过相邻位置间的信息共享,安全地降低低频组的空间分辨率,Deformable OctConv接收包含两个频率的特征映射,并直接从低频映射中提取信息,无需解码回到高频。
5.如权利要求4所述的基于深度学习的道路不规则区域检测网络,其特征在于:所述解码部分的Dupsample结构,将编码结构中的特征下采样与解码过程融合。
6.如权利要求5所述的基于深度学习的道路不规则区域检测网络,其特征在于:所述Dupsample结构嵌入到网络时使用softmax with t emperature函数来优化,函数表示如下:
其中,T为温度因子,使用梯度下降学习得到。
7.如权利要求6所述的基于深度学习的道路不规则区域检测网络,其特征在于:所述DOSEnet结构实现自动监督的注意力机制,分别为建议注意模块PAM和掩码注意模块MAM,互补前景信息和背景信息;建议注意模块PAM连接了RPN分支和背景分支,通过制作一个蒙版将RPN分支的信息作用于背景分支,使得分割任务集中更多注意力在局部目标上;所述建议注意模块PAM的后面还加入背景选择结构,过滤掉没有用的背景特征。
8.如权利要求7所述的基于深度学习的道路不规则区域检测网络,其特征在于:所述掩码注意模块MAM连接了前景和背景分支,互补二者的信息,用到1-sigmoid蒙版和背景选择;同时在掩码注意模块MAM中,采用RoIUpsample差值方法,解决在目标检测任务中的感兴趣区域ROI尺寸不同的问题。
9.如权利要求8所述的基于深度学习的道路不规则区域检测网络,其特征在于:解码部分采用双线性插值的上采样方法的DUpsample结构,建立每个像素之间预测的相关性,其模型减少对特征图分辨率的依赖。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学苏州汽车研究院(吴江),未经清华大学苏州汽车研究院(吴江)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911372843.3/1.html,转载请声明来源钻瓜专利网。





