[发明专利]基于分组反向注意力的伪装物体检测方法及系统有效
申请号: | 202110180500.8 | 申请日: | 2021-02-08 |
公开(公告)号: | CN112907530B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 程明明;范登平;季葛鹏 | 申请(专利权)人: | 南开大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T5/00;G06T5/50;G06T7/181;G06V10/40;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分组 反向 注意力 伪装 物体 检测 方法 系统 | ||
1.基于分组反向注意力的伪装物体检测方法,其特征是,包括:
获取待检测图像;对待检测图像进行特征提取;具体包括:
基于Res2Net-50骨架网络,对待检测图像进行特征提取;
其中,Res2Net-50骨架网络,包括:依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块和第五卷积块;
第一卷积模块,对待检测图像进行卷积处理,输出第一特征图;
第二卷积模块,对第一特征图进行卷积处理,输出第二特征图;
第三卷积模块,对第二特征图进行卷积处理,输出第三特征图;
第四卷积模块,对第三特征图进行卷积处理,输出第四特征图;
第五卷积模块,对第四特征图进行卷积处理,输出第五特征图;
基于特征提取结果,对待检测图像中的伪装物体进行搜索,得到伪装物体的定位图;具体包括:
第三特征图,经过第一纹理增强模块进行处理,输出第一纹理增强图;
第四特征图,经过第二纹理增强模块进行处理,输出第二纹理增强图;
第五特征图,经过第三纹理增强模块进行处理,输出第三纹理增强图;
第一、第二和第三纹理增强图,同时输入到近邻连接部分解码器,得到伪装物体的定位图;
所述第一纹理增强模块,包括:一条残差分支和四条侧分支;
其中,四条侧分支彼此之间为并联关系;
其中,四条侧分支包括:第一侧分支、第二侧分支、第三侧分支和第四侧分支;
残差分支,包括:依次连接的卷积核为1*1卷积层和加法器;
第一侧分支,包括:一个卷积核为1*1的卷积层;
第二侧分支,包括:四个串联的卷积层,依次为卷积核为1*1的卷积层、卷积核为1*3的卷积层、卷积核为3*1的卷积层和卷积核为3*3且空洞率为3的卷积层;
第三侧分支,包括:四个串联的卷积层,依次为卷积核为1*1的卷积层、卷积核为1*5的卷积层、卷积核为5*1的卷积层和卷积核为3*3且空洞率为5的卷积层;
第四侧分支,包括:四个串联的卷积层,依次为卷积核为1*1的卷积层、卷积核为1*7的卷积层、卷积核为7*1的卷积层和卷积核为3*3且空洞率为7的卷积层;
第一、第二、第三和第四侧分支的输入端均与残差分支的输入端连接,残差分支的输入端作为第一纹理增强模块的输入端;
第一、第二、第三和第四侧分支的输出端均与拼接器的输入端连接;
拼接器的输出端与加法器的输入端连接;
加法器的输出端作为第一纹理增强模块的输出端;
所述第一纹理增强模块、第二纹理增强模块和第三纹理增强模块的内部结构是一致的;
所述近邻连接部分解码器,内部结构包括:
第一输入端、第二输入端和第三输入端;
其中,第一输入端用于输入第一纹理增强图;
第二输入端用于输入第二纹理增强图;
第三输入端用于输入第三纹理增强图;
第一纹理增强图和第二纹理增强图经过第一乘法器处理得到第一乘法结果;
第二纹理增强图和第三纹理增强图经过第二乘法器处理得到第二乘法结果;
第一乘法结果和第二乘法结果经过第三乘法器处理,得到第三乘法结果;
将第二乘法结果、第三乘法结果和第三纹理增强图,输入到UNet结构解码器中,输出解码结果;
基于特征提取结果和伪装定位物体的定位图,利用分组反向注意力方式进行处理,得到伪装物体的轮廓图;具体包括:
对定位图进行下采样处理;
对下采样处理结果通过第一反向注意力模块进行处理;将第一反向注意力模块处理后的结果,输入到第一分组反向GRA模块组中,将得到的结果再与定位图进行相加,得到第一识别图;
对第一识别图通过第二反向注意力模块进行处理;将第二反向注意力模块处理后的结果,输入到第二分组反向GRA模块组中,将得到的结果再与第一识别图上采样的结果进行相加,得到第二识别图;
对第二识别图通过第三反向注意力模块进行处理;将第三反向注意力模块处理后的结果,输入到第三分组反向GRA模块组中,将得到的结果再与第二识别图上采样的结果进行相加,得到第三识别图;
对第三识别图采用激活函数进行处理,得到伪装物体的轮廓图;
所述第一分组反向GRA模块组,包括:三个依次串联的分组反向GRA模块;每个分组反向GRA模块,包括:
两个输入端和两个输出端;
其中,一个输入端用于输入第一反向注意力模块处理后的图像;
另外一个输入端用于输入对应的第三纹理增强图;
将第三纹理增强图沿着通道分成若干组;
并在每一组内插入经过第一反向注意力模块处理后的图像,得到插入结果;
将插入结果,沿着通道进行拼接,得到拼接特征图;
将拼接特征图进行卷积处理,并将卷积处理后的结果与第三纹理增强图逐点相加,得到新的特征图;
将新的特征图进行卷积处理后,得到单通道的图;
将单通道的图与第一反向注意力模块处理后的图像进行相加,得到新的图像;
所述第一分组反向GRA模块组、第二分组反向GRA模块组和第三分组反向GRA模块组的内部结构是一样的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110180500.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生态鼻综合整形的手术方法
- 下一篇:弹射式升降装置