[发明专利]一种面向遥感图像语义分割的深度学习模型的训练方法有效
| 申请号: | 202110434453.5 | 申请日: | 2021-04-22 |
| 公开(公告)号: | CN112990365B | 公开(公告)日: | 2021-08-17 |
| 发明(设计)人: | 吴敦;高广;孙华;应良中;费佳宁;卞婷玉 | 申请(专利权)人: | 宝略科技(浙江)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 宁波甬致专利代理有限公司 33228 | 代理人: | 高瑞霞 |
| 地址: | 315199 浙江省宁波市鄞*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 遥感 图像 语义 分割 深度 学习 模型 训练 方法 | ||
1.一种面向遥感图像语义分割的深度学习模型的训练方法,其特征在于:该方法包括下列步骤:
S1.将遥感图像进行裁切,生成若干张训练样本图片,将若干张训练样本图片组成训练样本集,将遥感图像对应的标签转化为二值图,将二值图裁切为与样本图片对应的标签图片;
S2.构建基于编码器-解码器的深度学习模型架构;
S3.通过所述深度学习模型架构在所述训练样本集上训练出一个样本过滤模型,训练样本过滤模型的过程为:采用优化器以及学习率调整方案对训练样本集中的训练样本图片训练一个周期,采用的最大学习率为0.002,最小学习率为0.0001,一共训练26轮,在每一轮训练中均应用指定发生概率的数据增强方案;所述应用指定发生概率的数据增强方案的具体步骤为:
(3-1).在水平翻转、竖直翻转中任选其一对训练样本集中的训练样本图片进行处理,指定发生概率为100%;
(3-2).应用随机高斯噪声对训练样本集中的训练样本图片进行处理,指定发生概率为20%;
(3-3).在随机亮度和对比度、随机伽马中选其一对训练样本集中的训练样本图片进行处理,指定发生概率为100%;
(3-4).在随机锐化、高斯模糊以及动态模糊中选其一对训练样本集中的训练样本图片进行处理,指定发生概率为100%;
(3-5).应用随机信息丢失对训练样本集中的训练样本图片进行处理,指定发生概率为20%;
(3-6).应用随机旋转缩放对训练样本集中的训练样本图片进行处理,指定发生概率为100%;
S4.使用步骤S3得到的样本过滤模型来对训练样本集中的训练样本图片进行预测,得到训练样本集中训练样本图片的预测结果,通过将训练样本图片的预测结果和训练样本图片对应的标签图片进行对比,挑选出训练样本集中标注质量高的优质样本,将若干张优质样本组成优质样本集;
S5.使用步骤S2中的深度学习模型架构来交替训练所述训练样本集和步骤S4得到的优质样本集,在交替训练过程中,使用了学习率调整方案和优化器,从而得到经过训练的预测模型;
S6.重复步骤S4~S5,得到多个所述经过训练的预测模型,并将这些经过训练的预测模型组成模型池;
S7.获取任意一张目标遥感图像,基于所述模型池使用模型并行集成的方式预测出目标遥感图像中的要素,并采用平均法得到目标遥感图像的二值图结果。
2.根据权利要求1所述的一种面向遥感图像语义分割的深度学习模型的训练方法,其特征在于:在步骤S2中,所述基于编码器-解码器的深度学习模型架构由编码器和解码器构成,所述编码器为在拥有若干样本的训练样本集上训练得到的预训练模型,所述解码器为卷积神经网络。
3.根据权利要求1所述的一种面向遥感图像语义分割的深度学习模型的训练方法,其特征在于:在步骤S4中,优质样本的挑选是根据训练样本集中的样本与其对应的预测结果之间的交并比来进行挑选的,一个优质样本必须满足训练样本集中的样本与其对应的预测结果之间的交并比大于既定阈值。
4.根据权利要求2所述的一种面向遥感图像语义分割的深度学习模型的训练方法,其特征在于:在步骤S5中,学习率调整方案为基于余弦退火的学习率调整方案,使用学习率调整方案和优化器来得到经过训练的预测模型的具体步骤包括:
SA1.设置最大学习率和最小学习率,以13轮为半个周期,对训练样本集和优质样本集进行1.5个周期的交替训练,共39轮;
SA2.调整最大学习率为其最大值的五分之一,使用线性预热的学习率调整方式继续交替训练训练样本集和优质样本集,共1轮;
SA3.继续使用余弦退火的学习率调整方案对训练样本集和优质样本集交替训练半个周期,共13轮。
5.根据权利要求4所述的一种面向遥感图像语义分割的深度学习模型的训练方法,其特征在于:在步骤S5中,使用所述深度学习模型架构来交替训练所述训练样本集和所述优质样本集的具体步骤包括:
SB1.训练优质样本集并应用随机裁切的数据增强方案,裁切大小为384*384,重复5轮;
SB2.训练训练样本集并应用随机裁切的数据增强方案,裁切大小为384*384,重复2轮;
SB3.训练优质样本集并应用随机裁切的数据增强方案,裁切大小为480*480,重复2轮;
SB4.训练训练样本集并应用随机裁切的数据增强方案,裁切大小为512*512,重复2轮;
SB5.训练训练样本集并应用随机裁切的数据增强方案,裁切大小为480*480,重复1轮;
SB6.训练优质样本集并应用随机裁切的数据增强方案,裁切大小为512*512,重复1轮。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宝略科技(浙江)有限公司,未经宝略科技(浙江)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110434453.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:管柱自动化输送装置
- 下一篇:一种水平式卷对卷PET膜镀铁生产线
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





