[发明专利]基于目标尺度的目标检测深度卷积神经网络构建方法有效
申请号: | 201910866933.1 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110659724B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 刘天弼;杜姗姗;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/08 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 郁旦蓉 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 目标 尺度 检测 深度 卷积 神经网络 构建 方法 | ||
本发明提供一种基于目标尺度的目标检测深度卷积神经网络构建方法,用于在检测某一尺度范围的目标的应用场景下,能够灵活多变、针对不同尺度的目标实现良好适应性的深度卷积神经网,其特征在于,包括:步骤S1,分析图像样本数据集中的所有图像的目标对象,确定目标尺度下限;步骤S2,根据用于目标检测的深度卷积神经网络的主干网结构,得到单个目标对象最终所需的特征数据量,并分析主干网结构的下采样倍数以及最佳下采样倍数;步骤S3,通过深度模型重构方法重构深度卷积神经网络,保证单个目标对象在执行分类运算之前保留充分的特征数据量;步骤S4,使用图像样本数据集对深度卷积神经网络进行训练直至准确率达到要求。
技术领域
本发明属于数字图像处理及深度学习领域,具体涉及一种基于目标尺度的目标检测深度卷积神经网络构建方法。
背景技术
机器视觉已广泛渗透到社会生活的各个领域,其中图像目标检测技术是一个重要的组成部分。目前目标检测技术普遍使用深度学习取代传统的数字图像处理技术,其中以卷积神经网络(Convolutional Neural Network,CNN)为深度学习在机器视觉领域的代表。然而,对于学术界现有的CNN模型,往往针对普遍的目标对象,在不同分辨率的图像中,不同大小尺度的目标,均执行统一的检测算法。这导致过小和过大的目标与一般尺度的目标相比,检出效果较差。然而,对于日常生活中常见的一些场景,需要进行目标检测的图像分辨率不变,且图像中的目标尺度在一定范围内变动,例如区域监控视频,行车记录仪等,其检测目标的尺度集中在某一相对较窄范围,这就需要有一种手段,将目标检测算法集中在这些尺度的目标上,提高检测效率。
深度学习革命爆发在2011~2012年,深度学习革命使得计算机视觉在很多应用领域达到了实用水平,催生了工业界的大量应用。其最重要的原因是深度学习可以做到传统方法无法企及的精度,尤其是基于卷积神经网络CNN的深度学习模型,现在已经成为计算机视觉的主流方法。
卷积神经网络是一种常见的深度学习网络架构,受生物自然视觉认知机制启发而来。CNN能够得出原始图像的有效表征,这使得CNN能够直接从原始像素中,经过极少的预处理,捕获到视觉上面的规律。
目标检测是当前最热的话题之一,它需要对很多对象进行分类和定位。目前几乎所有的深度卷积神经网络,都使用从图像分类继承而来的骨干网。用于图像分类的CNN网络是不断对图像进行特征提取,同时一次次执行下采样,最终得到精简到一定程度的特征数据。
然而,使用了这种主干网的目标检测深度卷积神经网络,会在一定程度上受到特征提取方式的限制:对于大小适中的目标,检测算法能够很好地完成检测任务;对于其它尺度的目标尤其是小目标,往往会由于在检测算法的迭代过程中导致目标的特征数据损失过多,导致该检测算法的准确率往往不高并伴有较为严重的丢失率。
发明内容
为解决上述问题,提供一种在检测某一尺度范围的目标的应用场景下,能够灵活多变、针对不同尺度的目标实现良好适应性的深度卷积神经网络的构建方法,本发明采用了如下技术方案:
本发明提供了一种基于目标尺度的目标检测深度卷积神经网络构建方法,用于根据具体目标检测需求的目标尺度从而适当地调整网络结构,实现对特定目标的准确检测,其特征在于,包括:步骤S1,分析图像样本数据集中的所有图像的目标对象,确定目标尺度下限;步骤S2,根据用于目标检测的深度卷积神经网络的主干网结构,得到单个目标对象最终所需的特征数据量,并分析主干网结构的下采样倍数以及最佳下采样倍数;步骤S3,通过深度模型重构方法重构深度卷积神经网络,保证单个目标对象在执行分类运算之前保留充分的特征数据量;步骤S4,使用图像样本数据集对深度卷积神经网络进行训练直至准确率达到要求,其中,深度模型重构方法分为两种方案,在步骤S3中重构深度卷积神经网络时,根据计算资源是否充足选择深度模型重构方法的方案:方案一,当图像分辨率较小且计算资源充足时,通过下采样倍数以及最佳下采样倍数之间的落差将图像进行拉伸;方案二,当计算资源有限时,根据分类预测对特征数据量的需求,改变主干网结构的下采样次数,自后向前重构网络层结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910866933.1/2.html,转载请声明来源钻瓜专利网。