[发明专利]一种基于深度学习的船舶目标识别检测方法在审
| 申请号: | 202211030296.2 | 申请日: | 2022-08-26 |
| 公开(公告)号: | CN115471746A | 公开(公告)日: | 2022-12-13 |
| 发明(设计)人: | 郭富海;李晨浩;王鸿显;张政;杜鹏;胡春洋;陈秀敏 | 申请(专利权)人: | 中船航海科技有限责任公司 |
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06N3/04;G06N3/08;G06V10/25;G06V10/44;G06V10/75;G06V10/80;G06V10/82 |
| 代理公司: | 上海智力专利商标事务所(普通合伙) 31105 | 代理人: | 周涛 |
| 地址: | 200136 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 船舶 目标 识别 检测 方法 | ||
本发明公开了一种基于深度学习的船舶目标识别检测方法,包括如下步骤:(1)采集船舶航行水域的图像样本;(2)对图像进行预处理及标注;(3)进行数据增强,制作用于训练的数据集;(4)基于YOLOv4网络构建深度学习网络模型;(5)使用预训练的参数作为初始权重,训练深度学习网络;(6)将处理后的待检测图片输入骨干网络进行特征提取,经过颈部网络进行特征融合,并进行非极大值抑制操作,完成对船舶目标的预测;(7)进行输出后处理,使用置信度阈值进行结果过滤,结合其他指标判断得到最优的检测结果。本发明在复杂海域中提高小目标检测能力和多目标分类效果。
技术领域
本发明属于目标识别领域,具体涉及一种基于深度学习的船舶目标识别检测方法。
背景技术
目标识别是智能交通领域的一个重要课题,经济全球化的不断发展使海上运输需求迅猛上升,随着船只数量日益增长,海上航行的安全性备受人们关注。为了提高船舶航行的效率、可靠性和安全性,目前航运业正逐步向船舶自动驾驶、自动避障、自动进离码头的智能化、全自动化方向发展,使得智能船舶逐渐成为一个新的研究方向。
随着水上交通流量密度的增加,导航环境越来越复杂。船舶的目标识别能力直接关系到海上(江河)航行安全。在将卷积神经网络应用于船舶目标检测之前,传统的船舶目标检测算法主要包括区域选择、结合特征提取和背景纹理建模等。近年来,深度学习技术被广泛用于目标检测领域,这进一步提升了船舶实时目标识别检测能力。但在实际海上航行中往往伴随着多变的自然条件和复杂的活动场景,这使其在复杂海域中目标识别检测效果并不理想。比如,小目标集群、船只密集且类型复杂、海面大雾影响造成目标模糊等,这些问题使得检测海域具有较高的复杂性,很难准确区分、识别目标间的差异,对船舶目标识别检测能力有了更高的要求。
发明内容
本发明的目的在于克服上述现有技术中存在的不足,提出一种基于深度学习的船舶目标识别检测方法,在复杂海域中提高小目标检测能力和多目标分类效果。
为实现上述发明目的,本发明提供一种基于深度学习的船舶目标识别检测方法,包括如下步骤:(1)采集船舶航行水域的图像样本;(2)对图像进行预处理及标注;(3)进行数据增强,制作用于训练的数据集;(4)基于YOLOv4网络构建深度学习网络模型;(5)使用预训练的参数作为初始权重,训练深度学习网络;(6)将处理后的待检测图片输入骨干网络进行特征提取,经过颈部网络进行特征融合,并进行非极大值抑制操作,完成对船舶目标的预测;(7)进行输出后处理,使用置信度阈值进行结果过滤,结合其他指标判断得到最优的检测结果。
进一步地,所述步骤(2)中,对采集的图像使用LabelImage进行至少以下五种海面目标的标注:散货船、集装箱船、渔船、游轮、岛屿。
进一步地,所述步骤(3)中,使用Mosaic数据增强的方法制作用于训练的数据集,采用4张图片一组,随机缩放、随机裁剪、随机排布的方式进行拼接,得到新的4张图像,使其输入总数不变,并对得到的新的图像采取随机遮挡。
进一步地,所述步骤(4)中,所述深度学习网络模型包括骨干特征提取网络、SPP结构、PANet多路径特征融合结构和Head检测头结构;所述骨干特征提取网络使用尺寸为640*640的RGB图像作为输入,经过卷积、BatchNormalization和Mish激活函数后,再通过尺寸分别为(320,320,64),(160,160,128),(80,80,256),(40,40,512),(20,20,1024)的残差块结构;进行特征提取后,最后一个残差块的输出经过SPP结构,拼接后将经过CSP与CBL结构的结果与主干网络倒数第二和倒数第三个残差块的输出结果一起作为PANet结构的输入;所述PANet结构,进行一系列的上采样、下采样和卷积操作,并将三个输入进行多路径特征融合处理,然后输入Head;所述Head将输出解码前船舶的目标坐标信息,包括目标框横坐标x、目标框纵坐标y、目标框宽w及目标框高h,分类置信度和目标有无置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中船航海科技有限责任公司,未经中船航海科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211030296.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双三相分布式组合线型电机低损耗绕组结构
- 下一篇:一种车辆投影方法及设备





