[发明专利]一种高精度水下激光目标识别系统有效
申请号: | 202110023549.2 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112926619B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 刘兴高;万子宁;王文海;张志猛;张泽银 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高精度 水下 激光 目标 识别 系统 | ||
1.一种高精度水下激光目标识别系统,其特征在于:包括依次相连的水下激光探测器、数据库及上位机,所述上位机包括依次相连的数据生成模块、数据预处理模块、目标分类模块和结果显示模块;所述激光探测器对所检测水域进行探测,并将得到的图像存储到所述的数据库,数据生成模块对激光探测器采集到的图像进行生成,以扩展可用图像数量;数据预处理模块将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,目标分类模块使用残差卷积神经网络训练目标分类器,使用该搭建好的残差卷积神经网络进行目标分类的训练,对预处理后的图像数据进行识别,结果显示模块将目标分类的结果展示在上位机中;
所述数据生成模块对激光探测器采集到的图像进行生成,以扩展可用图像数量,采用如下过程完成:
(1)从数据库中采集K个图像作为训练样本集,记为其中代表第i个训练样本;
(2)从噪声数据先验分布P(z)中采集K个噪声作为噪声样本集,记为其中代表第i个噪声样本;
(3)采用卷积神经网络作为生成器G,从噪声数据中生成新的数据,其中代表第i个新生成的样本;
(4)采用卷积神经网络作为判别器D,并更新判别器的参数θd,具体公式如下:
其中,VD为判别器D关于θd的损失函数,为第(1)步中采集的训练样本,为第(3)步中生成的新样本,i为样本索引,m为训练批次大小,η为学习率,为关于θd的梯度;
(5)更新生成器G的参数θg,具体公式如下:
其中,VG为判别器G关于θG的损失函数,为第(2)步中采集的噪声样本,i为样本索引,m为训练批次大小,η为学习率,为关于θg的梯度;
(6)重复上述(1)~(5)步骤,直到VD和VG收敛;
(7)设定想要生成的图片数目M,从噪声数据先验分布P(z)中采集M个噪声作为噪声样本,采用训练好的生成器G,从噪声数据中生成新的数据其中将新生成的图片数据加入数据库;
所述数据预处理模块将水下激光探测器采集的图像数据和新生成的图像数据进行预处理,采用如下过程完成:将数据库中所有样本图像其中代表第i个样本图像,总数为N;对训练样本的灰度直方图进行均衡化处理,公式如下:
其中,i=1,2,...,N,j=0,1,2,...,L-1,uij第i个样本的第j个灰度级均衡化后的结果,RN表示图像像素的行数,CN表示图像像素的列数,L表示图像的灰度级数量,ne表示当前图像中灰度为re的像素的个数,pr(re)表示概率分布,T(rj)表示当前图像中第j个灰度级的直方图均衡化变换;灰度直方图进行均衡化处理后的图像为U={u1,u2,...,uN}。
2.根据权利要求1所述一种高精度水下激光目标识别系统,其特征在于:所述目标分类模块使用残差卷积神经网络训练目标分类器;残差卷积神经网络在深度学习框架下构建,构建的残差卷积网络具体结构为:
(1)卷积池化层:首先对128×128×3的输入图像作卷积,卷积核个数为64、大小为7×7、移动步数为2,对卷积层的输出进行ReLU非线性变换后作最大值池化,池化窗口大小为2×2、移动步数为2,最后输出的特征图维数为32×32×64;
(2)残差结构块一:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为64、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为128、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为128、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为128、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为16×16×128;
(3)残差结构块二:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为128、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为256、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为256、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为256、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为8×8×256;
(4)残差结构块三:由3个残差结构组成,第一个和第二个残差结构的卷积层的卷积核个数都为256、窗口大小都为3×3、移动步数都为1,捷径连接为恒等映射,第三个残差结构的第一个卷积层的卷积核个数为512、卷积窗口大小为3×3、移动步数为2,第二个卷积层的卷积核个数为512、窗口大小为3×3、移动步数为1,其捷径连接含有一个卷积核个数为512、窗口大小为3×3、移动步数为2的卷积层,最终输出的特征图维数为4×4×512;
(5)分类器:对残差结构块三的输出作全局平均池化,得到512维的特征向量,再用全连接层对该向量进行降维,全连接层神经元数与目标类别数相等,采用softmax激活函数作分类,输出结果为的预测目标为各类别的概率;
使用该搭建好的残差卷积神经网络进行目标分类的训练:
(A)将预处理后的样本集划分为训练集和测试集;
(B)使用训练集中的样本对残差卷积神经网络模型进行训练,在测试集上进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110023549.2/1.html,转载请声明来源钻瓜专利网。