[发明专利]基于深度学习和分组卷积的目标检测方法及系统有效
| 申请号: | 201810374361.0 | 申请日: | 2018-04-24 |
| 公开(公告)号: | CN108764287B | 公开(公告)日: | 2021-11-16 |
| 发明(设计)人: | 张毅锋;蒋程;李莹莹;刘袁 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
| 地址: | 210018 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 分组 卷积 目标 检测 方法 系统 | ||
本发明公开了一种基于深度学习和分组卷积的目标检测方法,涉及到基于深度学习的目标检测领域;其方法设计了一种新的网络结构:双路结构,双路结构主要包括主路结构和支路结构。该目标检测方法包括以下步骤:1)、对输入图像进行预处理;2)、基于区域推荐网络在输入图像上生成大量候选区域;3)、利用基于双路结构的卷积神经网络提取各候选区域的特征;4)、将所提取的特征输入分类器,进行分类。本发明还提出一种目标检测系统,包括图像采集单元,图像分析单元,分类单元。本发明解决了数据量、计算量大所导致的检测效率低的问题,达到了降低人力成本、提高安保等工作效率的效果。
技术领域
本发明涉及一种目标检测方法及系统,属于图像处理、计算机视觉、深度学习技术领域。
背景技术
随着社交网络等的快速发展,图像、视频等视觉数据呈现指数级增长。如何有效地利用这些视觉数据成了亟需解决的难题。
传统机器学习算法在处理受到不同姿态、光照变化、遮挡等干扰影响的图像时,识别率不高。深度学习算法的出现为解决这一问题提供了有效的方法。深度学习算法可以比传统机器学习算法更有效地提取视觉数据中的信息。目标识别与检测是深度学习算法的两个重要应用领域。经典的卷积神经网络结构包括VGG网络、Network in Network网络、GoogleNet网络等。但是这些网络在层数继续增加的时候会出现性能退化的情况。为了克服这一问题,学者们又相继提出ResNet网络、DenseNet网络等。但是ResNet网络相对而言容易发生过拟合,DenseNet网络产生的特征数量非常大。克服其各自的缺点并综合其优点,是亟需解决的难题。
发明内容
本发明所要解决的技术问题是:为了克服现有技术的缺点和不足,本发明提供一种可有效提高识别性能、参数效率、计算效率的新型网络结构——双路结构,并将其用于目标识别与检测领域。
为解决以上技术问题,本发明采用的技术方案为:
本发明首先提出一种基于深度学习和分组卷积的目标检测方法,包括如下步骤:
1)、采集图像信息;
2)、依次进行图像预处理、基于区域推荐网络的候选区域生成、基于深层卷积网络的特征提取,包括如下步骤:
2.1)、进行逐样本均值削减,即从图像中移除平均亮度值,并进行归一化处理;
2.2)、基于深度学习算法选出图像中大量可能包括目标的区域;
2.3)、基于双路结构的卷积神经网络提取出有效特征,用于表征目标;
3)、将步骤2.3提取出的有效特征输入分类器,进行分类并完成可视化显示效果。
进一步的,本发明所提出的目标检测方法,所述步骤2.3中的双路结构包括主路结构和支路结构,基于双路结构的卷积神经网络提取出有效特征的方法如下:
2.3.1)、主路结构采用基于拼接方式的跨层连接结构,产生不同组的卷积特征;
2.3.2)、支路结构的输入为主路结构所产生的不同组的卷积特征,一条支路对应于一组卷积特征,每条支路所进行的操作如下:
2.3.2.1)、对支路的输入进行批规范化处理;
2.3.2.2)、利用ReLU函数对步骤2.1的输出进行非线性处理;
2.3.2.3)、对步骤2.2的输出进行3×3卷积操作;
2.3.3)、将主路结构和支路结构在双路结构的最后部分进行相加融合,提取出有效特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810374361.0/2.html,转载请声明来源钻瓜专利网。





