[发明专利]一种基于卷积神经网络的图像目标检测方法,系统及可读存储介质在审
| 申请号: | 202110188935.7 | 申请日: | 2021-02-19 |
| 公开(公告)号: | CN113052006A | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 唐琎;陶思萌;李志勇;朱立军 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 姚瑶 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 图像 目标 检测 方法 系统 可读 存储 介质 | ||
本发明公开了一种基于卷积神经网络的图像目标检测方法、系统及可读存储介质,该方法包括如下步骤:采集图像样本,并对图像样本中的目标进行标记;构建基于一阶段网络的轻量型深度卷积网络;所述轻量型深度卷积网络的FPN网络架构中增设空间辅助激励模块AE、通道注意力模块SE、轻量型的卷积模块ConvSet;将图像样本进行聚类获得k个瞄框Anchor;将图像样本输入轻量型深度卷积网络,并基于所述瞄框Anchor进行模型训练得到目标检测模型;利用构建的目标检测模型识别待检测图像中的所述目标。本发明该方法可以应用于图像中的船舶检测,提高了检测速率以及精度,保证了实际应用中实时性检测需求。
技术领域
本发明属于计算机视觉、模式识别以及目标检测技术领域,具体涉及一种基于卷积神经网络的图像目标检测方法,系统及可读存储介质。
背景技术
近年以来,各种涉海、用海等活动越来越多,并且规模越来越大,海上各种安全事故、违章、违法船行为相应也越来越多,海上船舶检测工作日益繁重。
现在船舶检测技术主要有船舶自动识别系统(简称AIS)与岸基雷达,但是AIS信息存在主观错误,而雷达目标存在信息缺失等问题,因此在各种港口、沿海以及江河沿岸都布置了大量的视频摄像头,对上述技术进行辅助监控。但是现有视频监控主要以人工监控为主,效率和利用率较低。针对上述问题,相关研究人员利用图像处理与机器学习结合等方法进行船舶的检测以及监控。比较经典的方法是首先使用灰度直方图统计,以获得船舶的边缘信息,然后根据形状分析提取特征,然后利用支持向量机等分类方法对候选特征区域进行鉴别。这种检测方法泛化性能较差,在环境、光照等因素影响下容易导致误检和漏检问题。
卷积神经网络能够从数据中逐层自动地提取特征,不需要人工设计特征,在各种图像处理领域有着广泛的作用。在目标检测领域,从2014年由微软亚洲研究员RossGirshick首次提出R-CNN开始,深度学习技术应用到目标检测开启了崭新的篇章,其在输入图像上使用选择搜索算法得到可能是目标的候选区域,然后将每个候选区域送入CNN网络中,提取一个固定长度的特征向量,最后使用支持向量机对特征向量进行分类。其在VOC 2012数据集上平均准确率达到53.3%,随后针对R-CNN存在的问题,后续提出了FastR-CNN和Faster R-CNN 等网络,这些网络由于其检测算法的特点统称为两阶段检测网络,它们具有较高的准确率,但是检测速度非常慢基本达不到实时性的要求。针对上诉问题,2016年Joseph Redmon等人相继提出YOLO v1、SSD、YOLO v2、RetinaNet、YOLOv3等检测网络,这些网络由于其检测算法输入图片直接输出物体位置和类别,统称为一阶段网络。以YOLOV3为例子,其首先对输入的图片使用CNN网络进行特征提取,对于提取到的特征使用FPN进行语义信息和尺度信息的融合重组以得到不能尺度大小的三层特征层,分别利用这些特征层进行分类和回归多任务学习。它的检测速度相比两阶段检测网络快速,在CPU上测试基本能达到实时性要求,但是它的缺点是相比两阶段检测精度较低。
因此,如何应用卷积神经网络中YOLOV3来实现图像中类似船舶等目标的检测,并提高检测精度的问题是本发明亟需解决的。
发明内容
本发明的目的是提供一种基于卷积神经网络的图像目标检测方法,系统及可读存储介质,所述方法可以应用于图像中的船舶检测,能够实现全天候海上船舶检测的功能,解决原有传统方法受环境因素影响大、抗干扰能力弱,以及现有深度学习方法检测精度低等问题。
一方面,本发明提供的一种基于卷积神经网络的图像目标检测方法,包括如下步骤:
采集图像样本,并对图像样本中的目标进行标记;
构建基于一阶段网络的轻量型深度卷积网络;
所述轻量型深度卷积网络的FPN网络架构中增设空间辅助激励模块AE、通道注意力模块SE、轻量型的卷积模块ConvSet;
将图像样本进行聚类获得k个瞄框Anchor;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110188935.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水泥砂浆塑性收缩开裂减裂方法
- 下一篇:一种多功能型扫地机
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





