[发明专利]基于小样本的多任务组合模型的训练方法有效
申请号: | 202310331508.9 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116070119B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 谢新林;鲁锦涛;董铱斐;邹圣兵 | 申请(专利权)人: | 北京数慧时空信息技术有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24;G06N3/084;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100070 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 任务 组合 模型 训练 方法 | ||
1.一种基于小样本的多任务组合模型的训练方法,包括:
S1:获取遥感影像训练集,包括无标记数据集和有标记数据集;
S2:构建多任务组合模型,所述多任务组合模型包括1个主干网络和n个子网络,其中主干网络和子网络通过串联方式连接,子网络之间通过并联方式连接,n≥2;
S3基于无标记数据集对主干网络进行第一训练,得到第一训练的主干网络;
S4 基于有标记数据集对n个子网络进行第二训练,得到n个第二训练的子网络;
S5 将1个第一训练的主干网络和n个第二训练的子网络作为训练完成的多任务组合模型。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
S6将1个多任务组合模型拆分为n个单任务模型,每个单任务模型包括1个第一训练的主干网络和1个第二训练的子网络;
S7基于有标记数据集对单任务模型进行第三训练,得到第三训练的单任务模型,包括第三训练的主干网络和第三训练的子网络。
3.根据权利要求1所述的方法,其特征在于,所述对主干网络进行第一训练是基于对自编码器进行训练实现的,所述自编码器包括主干网络和解码器,步骤S3包括:
S31将无标记数据集输入主干网络进行特征提取,得到无标记特征集;
S32将无标记特征集输入解码器中进行解码,得到重构数据集,并根据下式计算重构损失函数:
其中,表示重构损失,表示无标记数据,表示重构数据,表示主干网络的参数,表示解码器的参数;
S33通过重构损失函数对主干网络的参数和解码器的参数进行微调;
S34迭代的执行S31-S33,直至达到预设的收敛条件,得到第一训练的主干网络和第一训练的解码器。
4.根据权利要求1所述的方法,其特征在于,所述有标记数据包括多任务标签,多任务标签包括回归标签、分类标签、分割标签中至少两种。
5.根据权利要求4所述的方法,其特征在于,步骤S4包括:
S41将有标记数据集输入第一训练的主干网络进行特征提取,得到共享特征集;
S42将共享特征集分别输入子网络,得到子网络的预测结果,基于子网络的预测结果和多任务标签计算任务损失函数,所述任务损失函数包括L1损失函数、MSE损失函数和交叉熵损失函数;
S43固定第一训练的主干网络的参数,通过任务损失函数对子网络的网络参数进行微调;
S44迭代执行S41-S43,直至子网络的任务损失函数都达到预设的收敛条件,得到第二训练的子网络。
6.根据权利要求2所述的方法,其特征在于,步骤S7包括:
S71将有标记数据输入单任务模型,得到单任务模型的预测结果,并基于单任务模型的预测结果和多任务标签计算任务损失函数,所述任务损失函数包括L1损失函数、MSE损失函数和交叉熵损失函数;
S72通过任务损失函数对单任务模型的参数进行微调,包括对主干网络的参数进行微调和对子网络的参数进行微调;
S73迭代执行S71-S72,直至单任务模型的任务损失函数达到预设的收敛条件,得到第三训练的单任务模型,包括第三训练的主干网络和第三训练的子网络。
7.根据权利要求1所述的方法,其特征在于,所述子网络包括分类子网络、分割子网络、回归子网络。
8.根据权利要求3所述的方法,其特征在于,所述自编码器为降噪自编码器、稀疏自编码器、栈式自编码器中的至多一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数慧时空信息技术有限公司,未经北京数慧时空信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310331508.9/1.html,转载请声明来源钻瓜专利网。