[发明专利]基于深度可分离空洞卷积的轻量级水下目标检测方法有效
| 申请号: | 202110688073.4 | 申请日: | 2021-06-21 |
| 公开(公告)号: | CN113420643B | 公开(公告)日: | 2023-02-10 |
| 发明(设计)人: | 沈钧戈;毛昭勇;丁文俊;刘楠 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06V20/05 | 分类号: | G06V20/05;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 可分离 空洞 卷积 轻量级 水下 目标 检测 方法 | ||
1.一种基于深度可分离空洞卷积的轻量级水下目标检测方法,其特征在于包括下述步骤:
步骤1:使用水下机器人拍摄水下目标图像,人工进行数据标注,标注文件包括图片名称、图像尺寸、矩形边界框框坐标和目标物类别信息,图片与标注文件合并得到水下目标检测数据集;
步骤2:对基于VGG16的Faster R-CNN模型进行改进,使用单个DDG卷积模块一一代替网络中的普通卷积层和平均池化层,并在ROI池化层之前增加一个DDG卷积模块降低特征图通道数,减少分类网络的全连接层数和通道数;
使用DDG卷积模块代替网络中的普通卷积层,DDG卷积模块中可分离空洞卷积核大小与步长与原始网络对应位置普通卷积核相同,对输入三通道彩色图像进行深度可分离空洞卷积时,卷积系数设置为[1,2,3],之后所有DDG卷积模块中空洞卷积系数设置为[1,2,3,5]的循环,1*1分组卷积的分组数为输入通道数的1/4,每个卷积核通道数量为4;使用DDG卷积模块代替网络中的平均池化层,基于VGG16的Faster R-CNN模型有四个平均池化层,下采样率为16,首先去除第四平均池化层,使得下采样率变为8,特征图分辨率扩大一倍,然后使用DDG卷积模块代替网络中剩下三个平均池化层,并设置DDG卷积模块中的卷积步长为2,空洞卷积系数设置为[1,2,3,5]的循环;在ROI池化层之前增加一个深度可分离卷积层降低特征图通道数,基于VGG16的FasterR-CNN模型输出特征图通道数为512,增加一个深度可分离卷积层,先进行逐通道卷积,再进行逐点卷积,其中逐点卷积的卷积核数量设置为10,使得输出特征图通道数为10;
步骤3:读取水下目标检测数据集,对步骤2中改进后模型进行训练和测试,得到检测模型权重;
步骤4:在水下机器人平台上搭载检测模型和训练后检测模型权重,对水下图像进行实时检测,识别水下目标。
2.根据权利要求1所述的基于深度可分离空洞卷积的轻量级水下目标检测方法,其特征在于:
所述图像和标注文件按6:2:2的比例随机划分训练集、测试集和验证集。
3.根据权利要求1所述的基于深度可分离空洞卷积的轻量级水下目标检测方法,其特征在于:
所述DDG卷积模块中:对于输入特征图,尺寸为H*W,通道数为C,对输入特征图进行深度可分离卷积,卷积核大小为K*K,卷积方式为空洞卷积,共有C个单通道可分离空洞卷积核,由于原始网络特征图通道数C均为4的倍数,将可分离空洞卷积核的空洞卷积系数设置为[1,2,3,5]的循环;可分离空洞卷积的输出再通过一个1*1的分组卷积进行特征融合,分组卷积每个卷积核通道数为4,分组数目为C/4,卷积核数量等于输出通道数数量。
4.根据权利要求3所述的基于深度可分离空洞卷积的轻量级水下目标检测方法,其特征在于:
对于三通道彩色图像,可分离空洞卷积核数与图像通道数相等,空洞系数从
[1,2,3,5]中按顺序选取为[1,2,3],对应分组卷积每个卷积核通道数为3。
5.根据权利要求1所述的基于深度可分离空洞卷积的轻量级水下目标检测方法,其特征在于:
减少分类网络的全连接层数和通道数;基于VGG16的Faster R-CNN模型的分类网络,具有两个通道数为4096的全连接层,首先去除一个4096全连接层,再将剩下的一个全连接层通道数从4096减小为2048,最后通过两个并行的输出层进行分类和回归。
6.根据权利要求1所述的基于深度可分离空洞卷积的轻量级水下目标检测方法,其特征在于:
所述步骤3中,网络模型训练的步骤为:
网络模型训练时,每次输入一张图片进行计算,首先经过m次的DDG卷积模块,得到相应特征图,输入RPN网络,生成锚框,并进行分类和回归,选择N个正负样本,将其预测值与真实边界框一次送入损失函数计算分类和回归损失,锚框经过回归系数回归得到ROI,选择N个正负样本中的N1个正负样本通过全连接层,得到预测类别分数以及回归系数,与真实边界框一起计算分类和回归损失,由损失进行反向传播,更新网络权重;不断迭代计算,每训练p次计算一次损失并输出,完成一轮训练后保存相应权重文件,当损失收敛不再下降,即可得到最终模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110688073.4/1.html,转载请声明来源钻瓜专利网。





