[发明专利]一种注意力引导的可变形自注意力的语义分割方法在审
申请号: | 202211527335.X | 申请日: | 2022-11-30 |
公开(公告)号: | CN115908812A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 雷晓春;潘奕伟;江泽涛;唐麟;张永雅;钱艺;赵佳 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/82;G06V10/80;G06V10/46;G06N3/045 |
代理公司: | 桂林市持衡专利商标事务所有限公司 45107 | 代理人: | 陈跃琳 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 注意力 引导 变形 语义 分割 方法 | ||
1.一种注意力引导的可变形自注意力的语义分割方法,其特征是,包括步骤如下:
步骤1、将原始图像进行预处理操作,即将原始图像的高度和宽度缩放为同一大小;
步骤2、对步骤1所得到的图像依次进行两次特征提取操作,分别得到一次特征提取后的特征图和两次特征提取后的特征图;
步骤3、通过生成步骤2所得到的两次特征提取后的特征图的注意力权重,并将特征图的重要特征进行强化,得到具有重要特征的权重特征图;
步骤4、将步骤3所得到的具有重要特征权重的特征图中低注意力权重的特征通道像素值设为0,从而得到高权重特征图;同时将步骤3所得到的具有重要特征权重的特征图中高注意力权重的特征通道像素值设为0,从而得到低权重特征图;
步骤5、将步骤4所得到的高权重特征图经过可变形自注意力Transformer操作,得到具有丰富的全局上下文信息的特征图;
步骤6、将步骤4所得到的低权重特征图进行双权重的双注意力操作,得到双注意力特征图;
步骤7、将步骤5所得到的具有丰富的全局上下文信息的特征图和步骤6所得到的双注意力特征图进行特征相加,得到注意力特征图;
步骤8、将步骤7所得到的注意力特征图进行三次注意力图的上采样操作后,得到上采样后的注意力特征图;
步骤9、将步骤8所得到的上采样后的注意力特征图进行卷积操作,得到降通道后的特征图;
步骤10、将步骤9所得到的降通道后的特征图与步骤2所得到的两次特征提取后的特征图进行通道拼接操作,得到第一通道拼接特征图;
步骤11、将步骤10所得到的第一通道拼接特征图进行通道拼接图的上采样操作,得到第一上采样通道拼接特征图;
步骤12、将步骤11所得到的第一上采样通道拼接特征图与步骤2所得到的一次特征提取后的特征图进行通道拼接操作,得到第二通道拼接特征图;
步骤13、将步骤12所得到的第二通道拼接特征图进行通道拼接图的上采样操作,得到第二上采样通道拼接特征图;
步骤14、对步骤13所得到的第二上采样通道拼接特征图进行卷积操作,得到分割结果图像。
2.根据权利要求1所述的一种注意力引导的可变形自注意力的语义分割方法,其特征是,步骤2中,每次特征提取操作均需要依次经过一次3×3的卷积操作、一次1×1的卷积操作、一次ReLU激活操作和一次最大池化操作来实现。
3.根据权利要求1所述的一种注意力引导的可变形自注意力的语义分割方法,其特征是,步骤3的具体过程为:
步骤3.1、将两次特征提取后的特征图进行全局平均池化操作,得到具有c个通道的特征图;
步骤3.2、将具有c个通道的特征图进行两次全连接操作,利用通道间的相关性训练权重,得到注意力权重;其中第一次全连接操作把c个通道压缩成为c/r个通道来降低计算量,且第一次全连接操作后面跟有ReLU激活操作,第二个全连接层再将通道数恢复为c,且第二次全连接操作后面跟有Sigmoid激活操作;其中r为压缩比例;
步骤3.3、将两次特征提取后的特征图和注意力权重进行全乘操作,得到具有重要特征的权重特征图。
4.根据权利要求1所述的一种注意力引导的可变形自注意力的语义分割方法,其特征是,步骤4中,将具有重要特征权重的特征图的各个特征通道的最高注意力权重和最低注意力权重相加再除以2得到平均注意力权重;若具有重要特征权重的特征图的特征通道的注意力权重小于等于平均注意力权重,则为低注意力权重的特征通道;若具有重要特征权重的特征图的特征通道的注意力权重大于平均注意力权重,则为高注意力权重的特征通道。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211527335.X/1.html,转载请声明来源钻瓜专利网。