[发明专利]一种改进两阶段目标检测的方法有效
| 申请号: | 202110516218.2 | 申请日: | 2021-05-12 |
| 公开(公告)号: | CN113516040B | 公开(公告)日: | 2023-06-20 |
| 发明(设计)人: | 段强;李雪;李锐;王建华 | 申请(专利权)人: | 山东浪潮科学研究院有限公司 |
| 主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/778;G06N3/0464;G06N3/082;G06V10/764 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 郗艳荣 |
| 地址: | 250100 山东省济*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 改进 阶段 目标 检测 方法 | ||
本发明特别涉及一种改进两阶段目标检测的方法。该改进两阶段目标检测的方法,先使用大规模的数据集对卷积神经网络进行预训练,提升特征识别能力;然后用预训练模型替换Faster RCNN的骨干网络VGG16,使用目标检测数据集对FasterRCNN网络中的分类层和RPN网络进行微调,以增强负责特征提取的卷积网络能力,进而提升分类层和RPN网络的性能。该改进两阶段目标检测的方法,运用开源常用的开发语言和库,与模型进行进一步优化,提高了负责特征提取的卷积网络能力,从而显著提升了两阶段目标检测的精度。
技术领域
本发明涉及深度学习与计算机视觉技术领域,特别涉及一种改进两阶段目标检测的方法。
背景技术
目标检测的任务就是确定图像当中是否有感兴趣的目标存在,接着对感兴趣的目标进行精准定位。当下非常火热的无人驾驶汽车,就非常依赖目标检测和识别,这需要非常高的检测精度和定位精度。目前,用于目标检测的方法通常属于基于机器学习的方法或基于深度学习的方法。
对于机器学习方法,首先使用SIFT、HOG等方法定义特征,然后使用支持向量机(SVM)、Adaboost等技术进行分类。
对于深度学习方法,深度学习技术能够在没有专门定义特征的情况下进行端到端目标检测,并且通常基于卷积神经网络(CNN)。但是传统的目标检测方法有如下几个问题:
1)光线变化较快时,算法效果不好;
2)缓慢运动和背景颜色一致时不能提取出特征像素点;
3)时间复杂度高;
4)抗噪性能差。
因此,基于深度学习的目标检测方法得到了广泛应用,该框架包含有FasterRCNN网络,Yolo网络,Mask R-CNN网络等。
当前绝大多数卷积神经网络训练都是基于ISLVRC 2012的ImageNet-1000数据集,而随着数据逐年增长和新模型的逐年开发,基于该数据集的预训练模型已经明显不适用于愈发复杂的任务。而目标检测方法是基于卷积神经网络的特征提取功能加上目标框搜索的功能,一个更好的特征提取器有助于提升目标检测各个阶段的表现。
目前诸如Inception模型、ResNet模型、DenseNet模型、EfficientNet模型等,均是参数量大、结构复杂、层数较深的网络,而ISLVRC 2012的ImageNet部分数据集已经不足以使网络训练到位。
为了有效提升目标检测的精度和识别能力,本发明提出了一种改进两阶段目标检测的方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的改进两阶段目标检测的方法。
本发明是通过如下技术方案实现的:
一种改进两阶段目标检测的方法,其特征在于:包括以下步骤:
第一步、数据集处理与预训练模型优化
使用大规模的数据集对卷积神经网络进行预训练,提升特征识别能力;
第二步、用预训练模型替换骨干网络
用预训练模型替换Faster RCNN的骨干网络VGG(Visual Geometry GroupNetwork,视觉几何群网络)16,使用目标检测数据集对FasterRCNN网络中的分类层和RPN(RegionProposal Network,区域生成网络)网络进行微调,以增强负责特征提取的卷积网络能力,进而提升分类层和RPN网络的性能。
所述第一步中,采用ImageNet全量数据对ResNet模型进行预训练,并对预训练模型进行保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮科学研究院有限公司,未经山东浪潮科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110516218.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高可靠性门锁及电气设备
- 下一篇:一种闲聊机器人实体跟踪方法





