[发明专利]基于分级轮廓代价函数的遥感图像语义分割方法在审
申请号: | 202210675935.4 | 申请日: | 2022-06-15 |
公开(公告)号: | CN114972759A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 韩振;吕宁;陈晨;原昊 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/34;G06V10/44;G06V10/774;G06V10/82;G06V20/13;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分级 轮廓 代价 函数 遥感 图像 语义 分割 方法 | ||
1.一种基于分级轮廓代价函数的遥感图像语义分割方法,其特征在于,构建Inception-v3 U-Net分割网络,利用分级轮廓代价函数监督分割网络的损失;该分割方法的具体步骤如下:
步骤1,生成训练集:
步骤1.1,随机选取前景与背景比例均衡的至少20张高分辨率遥感图像及其相对应的标签图像;将每张高分辨率图像以及相对应的标签图像均裁剪为224×224像素大小;
步骤1.2,选取裁剪后标签图像中前景像素占比在10%以上的标签图像,以及与标签图像所对应的遥感图像组成训练集;
步骤2,构建Inception-v3 U-Net分割网络:
步骤2.1,构建1个卷积模块:
搭建一个由第一卷积层、第二卷积层串联组成的卷积模块;
将第一、第二卷积层的卷积核大小均设置为1×1,步长均设置为1,边缘填充均设置为1;
步骤2.2,构建上采样子网络:
搭建一个由第一上采样模块、第二上采样模块、第三上采样模块、CBR模块依次串联组成的上采样子网络作为解码器;第一至第三上采样模块的结构相同,每个上采样模块的结构依次为:第一卷积层、第二卷积层、第三卷积层、BatchNorm层、激活层、上采样层;
将第一至第三卷积层的卷积核大小均设置为3×3,步长均设置为1,边缘填充均设置为1,将激活层的负数部分的斜率设置为0.2,激活层采用LeakyReLU函数实现,上采样层采用二倍最近邻上采样方式;
CBR模块的结构依次为:卷积层、BatchNorm层、激活层;将卷积层的卷积核大小设置为3×3,步长设置为1,边缘填充均设置为1,激活层的负数部分的斜率设置为0.2,激活层采用LeakyReLU函数实现;
步骤2.3,采用concatenate方式,将上采样子网络中的三个上采样模块的输入分别与Inception-v3网络中的三个Inception模块的输出连接、输入模块的输出与CBR模块的输入连接后,组成具有跳连接结构的Inception-v3网络;
步骤2.4,将具有跳连接结构的Inception-v3网络、卷积模块、上采样子网络依次串联,组成Inception-v3 U-Net网络;
步骤3,训练Inception-v3 U-Net网络:
将训练集输入到Inception-v3 U-Net网络中,使用梯度下降法,迭代更新Inception-v3 U-Net网络中各层的参数,直至总代价函数收敛为止,得到训练好的Inception-v3 U-Net网络;
步骤4,预测遥感图像:
步骤4.1,将待预测所有遥感图像依次裁剪为224×224大小,并对裁剪好的待预测遥感图像标好序号;
步骤4.2,将标号序号的图像依次输入训练好的Inception-v3 U-Net网络,得到裁剪后遥感图像分割结果;
步骤4.3,将裁剪后遥感图像的分割结果按照序号依次进行拼接,得到最终的分割结果。
2.根据权利要求1所述的基于分级轮廓代价函数的遥感图像语义分割方法,其特征在于,步骤3中所述的总代价函数如下:
其中,L表示总代价函数,N表示训练集中样本的总数,∑(·)表示求和操作,j表示训练集中样本的序号,LGCL(j)表示训练集中第j个样本的分级轮廓代价函数;
所述的分级轮廓代价函数LGCL(j)如下:
其中,Mgc表示训练集中第j个样本的分级轮廓权重矩阵Mgc中第i个像素的权重,yi与分别表示训练集中第j个样本中第i个像素的真实值与预测值,log(·)表示以2为底的对数操作;
所述的分级轮廓权重矩阵Mgc如下:
其中,G表示轮廓矩阵的向内分级级数,将目标区域的内部作为轮廓矩阵的正向,目标区域外部作为轮廓矩阵的负向,g表示轮廓矩阵中级数的序号,Gauss(·)表示高斯卷积函数,Kg表示第g级轮廓范围超参数,Γ表示每级轮廓的划分结果,δ表示轮廓范围的判定结果;
所述的每级轮廓的划分结果Γ是由下式得到的:
其中,Y表示训练集中的标签图像,S代表对标签图像进行膨胀或腐蚀操作时使用的卷积核,(Y;S)α表示对标签图像的膨胀或腐蚀操作,α为正数时表示对标签图像进行膨胀操作,α为负数时表示对标签图像进行腐蚀操作;
所述的轮廓范围的判定结果δ是由下式得到的:
δ=255·One-((Y;S)+1)-(Y;S)-1))
其中,One表示一个元素数值全为1的矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210675935.4/1.html,转载请声明来源钻瓜专利网。