[发明专利]基于主动深度学习的水下目标识别方法在审
申请号: | 202110377531.2 | 申请日: | 2021-04-08 |
公开(公告)号: | CN113111764A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 吕健坤;姜龙玉 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 张天哲 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主动 深度 学习 水下 目标 识别 方法 | ||
1.一种基于主动深度学习的水下目标识别方法,其特征在于,该方法包括如下步骤:
步骤1:对水声信号原始数据进行预处理,并将其划分为备选集和测试集,备选集和测试集为互斥关系,建立初始状态下为空集的训练集;
步骤2:从步骤1中划分的备选集中,选择一部分数据,获取标注后从备选集移动到训练集,作为初始训练数据;
步骤3:使用训练集中的数据训练CNN模型,并在训练完成时记录模型性能;
步骤4:在剩余的备选集中,按照主动学习策略,挑选一定数量的数据,获取标注后移动到训练集;
步骤5:重复步骤3和4,直至备选集中的所有数据都加入训练集;
步骤6:模型训练结束,根据每步记录的模型性能,得出模型性能随训练数据量的增多而增长的变化关系。
2.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤1中所述的对水声信号原始数据进行预处理,所述的数据预处理方法包括:对声信号高频部分进行预加重、将较长时间的信号划分为较短的片段的分帧、使帧的边缘平滑过渡到0的加窗。
3.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤1中所述的将水声信号数据划分为互斥的备选集和测试集,具体方法是:从所有预处理后的水声信号数据中,随机抽取20%作为测试集,剩余作为备选集,并对测试集中的数据进行标注以作为CNN模型性能评判的标准。
4.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤3中所述的使用训练集中的数据训练CNN模型,其中所述的CNN模型的结构如下表所示,它包含五个特征提取模块,前三个模块为一个卷积层+一个池化层的结构,后两个模块为两个卷积层+一个池化层的结构;特征提取后将输出展开成向量,随后连接三个全连接层,其中,第一个全连接层使用Dropout随机舍弃一部分神经元的输出,以降低过拟合;最后一个全连接层使用Softmax分类输出;此外,处理的是一维声呐回波数据,故网络中的特征图、卷积核和池化核都调整为一维结构;
5.根据权利要求1所述的基于主动深度学习的水下目标识别方法,其特征在于,步骤4中所述按照主动学习策略挑选一定数量的数据,其中所述主动学习样本选择策略包括:“不确定性标准”主动学习策略,以及“不确定性+多样性标准”主动学习策略。
6.根据权利要求5所述的基于主动深度学习的水下目标识别方法,其特征在于,所述“不确定性标准”主动学习样本选择策略的具体步骤是,从未标注样本中选择模型判定最模糊的样例,即模型对其所属类别的置信度最低的样例;对每一个样例x,使用分类器输出的可能性最大的两个预测的概率计算其不确定性,即unc(x):
式中,p(y1|x)和p(y2|x)分别表示分类器输出中,样例x可能性最大和次大的两个所属类别的概率;unc(x)的值越大,说明模型对可能性最大的样例的置信度越高,分类器越不可能将样例分错;因此,主动学习器选择unc(x)值最小的样例作为不确定性最大的样例,送予标注并添加进训练集。
7.根据权利要求5中所述的基于主动深度学习的水下目标识别方法,其特征在于,所述“不确定性+多样性标准”主动学习样本选择策略的具体步骤是,在“不确定性标准”的基础上,使用距离度量来判断样例多样性,再将不确定性和多样性综合考虑,选择不确定性较高、样本多样性较大的数据作为选择结果;使用高斯核距离来度量两个样本xi和xj之间的相似度:
其中,σ是高斯核参数,设为1;
计算样例x对于某个由样例构成的集合Z的相似度时,用样例样例x与集合Z中和它相似度最大的样例之间的距离来表示:
sim(x,Z)值越小,说明样例x与集合Z之间的相似度越小,亦即样例x与集合Z中已有元素的冗余程度越小,这样选择出的样例的多样性越大;
使用“不确定性+多样性标准”的主动学习策略选择n个样例用于训练,则先使用“不确定性标准”选择m个不确定性较大的样本构成集合M={x1,x2,…,xm},再从M中使用如下式所示的综合考虑不确定性和多样性的方法,选择n个最优的样本:
score(x)=λunc(x)+(1-λ)sim(x,M)
其中,λ为权衡参数,用于衡量不确定性和多样性的重要程度,设为0.8;最终计算出的score(x)分值最小的样例是综合考虑不确定性和多样性都较大的样例,其训练价值最大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110377531.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小型核电站的节水循环冷却系统
- 下一篇:带有定位机构的转向桥精加工装置