[发明专利]一种多尺度背景感知池化弱监督建筑物提取方法有效
| 申请号: | 202210318162.4 | 申请日: | 2022-03-29 | 
| 公开(公告)号: | CN114842330B | 公开(公告)日: | 2023-08-18 | 
| 发明(设计)人: | 郑道远;方芳;万波;李圣文;曾林芸;张嘉辉 | 申请(专利权)人: | 深圳市规划和自然资源数据管理中心;中国地质大学(武汉) | 
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/26;G06V10/40;G06V10/74;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/084;G06N7/01 | 
| 代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 孔灿 | 
| 地址: | 518000 广东省深圳市福田区香*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 尺度 背景 感知 池化弱 监督 建筑物 提取 方法 | ||
1.一种多尺度背景感知池化弱监督建筑物提取方法,其特征在于:包括以下步骤:
S1、获取高分辨率遥感影像并进行裁剪,根据建筑物边界框标注B,得到适当尺寸的高分辨率遥感影像和对应的边界框标签图M(p);
S2、构建特征提取器,并将所述适当尺寸的高分辨率遥感影像输入到特征提取器中,得到不同级别的特征图;
S3、根据所述不同级别的特征图以及边界框标签图,通过对不同级别特征图进行网格划分,利用边界框标签图来聚合各个网格单元的特征,得到不同级别的背景特征;
S4、根据不同级别的背景特征,检索边界框标签图中边界框内的背景区域,通过计算余弦相似度获得不同级别的背景注意力图A;
S5、根据所述不同级别的背景注意力图A,对其应用背景感知池化操作,得到不同级别的前景特征;
S6、根据得到的不同级别的前景特征和背景特征,应用不同的分类层,使用交叉熵损失函数计算分类损失,进行反向传播算法,以训练包含特征提取器和分类层的分类网络,得到训练好的特征提取器;
S7、将高分遥感影像再次输入至所述训练好的特征提取器,得到新的不同级别的特征图和新的背景注意力图,将新的不同级别的特征图于与对应级别的分类层的权重结合,得到多尺度的类激活图;
S8、将所述多尺度的类激活图进行加权平均,并对平均后的类激活图进行变异系数平滑操作,得到优化后的类激活图;
S9、根据新的背景注意力图和优化后的类激活图,分别得到背景一元项和前景一元项,并将其作为密集条件随机场的输入,得到建筑物伪标签;将所述建筑物伪标签和对应的高分遥感影像作为语义分割模型的输入,并进行训练;分割模型训练完成后,实现建筑物自动提取;
步骤S3中,不同级别的背景特征表示如下:
其中,p表示特征图中像素位置,f(p)表示某一级别的特征图,qj代表某一级别特征图条件下的第j背景特征;G(j)表示网格单元集合;
步骤S4中,背景注意力图A表示如下:
其中,J表示某一级别特征图划分的有效网格数量,B代表遥感图像中所有建筑物的边界框;||·||表示L2归一化;ReLU表示激活函数;
步骤S5中,背景感知池化计算方式如下:
其中,Bi表示第i个建筑物边界框,ri代表某一级别的前景特征。
2.如权利要求1所述的一种多尺度背景感知池化弱监督建筑物提取方法,其特征在于:步骤S1中边界框标签图M(p)具体表示形式如下:
其中,B代表遥感影像中所有建筑物的边界框,K代表边界框的数量;p指图像中像素的位置。
3.如权利要求1所述的一种多尺度背景感知池化弱监督建筑物提取方法,其特征在于:步骤S2中,特征提取器采用卷积神经网络层搭建的骨干网络;特征图的具体表示形式如下:
fi,i∈{1,2...,5}, (2)
其中i表示级别,特征提取器RepVGG输出5个不同级别的特征图;每个级别的特征图的维度表示如下:
4.如权利要求1所述的一种多尺度背景感知池化弱监督建筑物提取方法,其特征在于:步骤S7中多尺度的类激活图表示如下:
其中wbuilding表示分类层关于建筑物类别的权重,表示第i个尺度的建筑物类激活图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市规划和自然资源数据管理中心;中国地质大学(武汉),未经深圳市规划和自然资源数据管理中心;中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210318162.4/1.html,转载请声明来源钻瓜专利网。





