[发明专利]基于多尺度特征融合的视觉场景中镜面检测方法、系统在审
| 申请号: | 202111580757.9 | 申请日: | 2021-12-22 |
| 公开(公告)号: | CN114299368A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 李衍皓;谭鑫;马利庄 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/40;G06V10/82;G06N3/04 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 丁云 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 尺度 特征 融合 视觉 场景 中镜面 检测 方法 系统 | ||
1.一种基于多尺度特征融合的视觉场景中镜面检测方法,其特征在于,该方法包括:
提取原始图像的多尺度特征,得到多层级特征;
对于每一层级的特征,分别与相邻层级的特征进行特征堆叠与融合,得到每一层级下同时包含深层次语义信息以及高分辨率下位置信息的融合特征;
基于各层级的融合特征,从最深层级开始逐层向浅层级合并解码得到镜面检测结果。
2.根据权利要求1所述的一种基于多尺度特征融合的视觉场景中镜面检测方法,其特征在于,所述的融合特征具体通过如下方式获得:
S100:记当前处理的层级下的特征为fi,对浅一层级提取到的特征fi-1进行下采样,使得特征图的尺寸和fi对齐;
S110:对深一层级提取到的特征fi+1进行插值上采样,使得特征图的尺寸和fi对齐;
S120-S140:对经过上、下采样的fi+1、fi-1以及fi分别进行卷积操作,得到通道数一致的中间特征;
S150:将得到的中间特征拼接在一起;
S160:将拼接的中间特征送入卷积层进行运算;
S170:fi通过单一卷积层进行运算;
S180:将S160、S170的运算结果叠加得到融合特征。
3.根据权利要求1所述的一种基于多尺度特征融合的视觉场景中镜面检测方法,其特征在于,从最深层级开始逐层向浅层级合并解码具体包括:
对最深层级的融合特征进行空洞卷积交互融合操作,将输出特征进行非线性变化组合;
将非线性变化组合后的特征与上一层级的融合特征叠加合并,对合并后的特征进行空洞卷积交互融合操作,将输出特征进行非线性变化组合并传输至上一层级循环进行叠加合并、空洞卷积交互融合操作直至最浅层级输出镜面检测结果。
4.根据权利要求3所述的一种基于多尺度特征融合的视觉场景中镜面检测方法,其特征在于,所述的空洞卷积交互融合操作包括:
S200、对待处理的特征作扩张率为1的标准卷积;
S210、对待处理的特征作扩张率为2的空洞卷积;
S220、将S200、S210得到的不同感受野下特征进行拼接;
S230、将拼接后的特征进行卷积操作得到输出特征。
5.根据权利要求3所述的一种基于多尺度特征融合的视觉场景中镜面检测方法,其特征在于,非线性变化组合后的特征与上一层级的融合特征叠加合并时非线性变化组合后的特征进行上采样使得特征图的尺寸和上一层级的融合特征尺寸一致。
6.一种基于多尺度特征融合的视觉场景中镜面检测系统,其特征在于,该系统包括:
特征提取网络:提取原始图像的多尺度特征,得到多层级特征;
编码单元:用于对每一层级的特征分别与相邻层级的特征进行特征堆叠与融合,得到每一层级下同时包含深层次语义信息以及高分辨率下位置信息的融合特征;
解码单元:基于各层级的融合特征,从最深层级开始逐层向浅层级合并解码得到镜面检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111580757.9/1.html,转载请声明来源钻瓜专利网。





