[发明专利]一种基于优化候选区域的Faster R-CNN目标检测方法有效
申请号: | 201710450440.0 | 申请日: | 2017-06-15 |
公开(公告)号: | CN107368845B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 林耀荣;伍伟明;张巧灵 | 申请(专利权)人: | 华南理工大学;广州市长优电子有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 优化 候选 区域 faster cnn 目标 检测 方法 | ||
1.一种基于优化候选区域的Faster R-CNN目标检测方法,其特征在于,所述检测方法包括下列步骤:
S1、以深度学习CAFFE框架为实现平台,在原始的Faster R-CNN网络中增加一个候选区域优化网络,通过候选区域优化网络构成一个区域二分类器,候选区域优化网络的输入为候选区域生成网络的第一个卷积层输出的特征图和候选区域生成网络输出的目标候选区域,输出为优化的目标候选区域,其中第一个卷积层即特征映射层;
S2、利用卷积特征提取网络对输入图像进行特征提取,生成共享特征图;
S3、利用候选区域生成网络对生成的共享特征图进行处理,生成多种尺度和长宽比的目标候选区域;
S4、候选区域优化网络根据目标候选区域所包含的特征对目标候选区域进行目标/背景的二分类判别,然后排除被判别为背景的无效候选区域,得到优化后的目标候选区域;
S5、目标分类回归网络根据优化后的目标候选区域,从生成的共享特征图中提取区域特征,进行最终的目标类别判别以及目标边界框回归修正。
2.根据权利要求1所述的一种基于优化候选区域的Faster R-CNN目标检测方法,其特征在于,所述候选区域优化网络的输入层为一个区域池化RoIpooling层,输出层为一个Softmax层,中间为若干隐层,所有层级联连接。
3.根据权利要求2所述的一种基于优化候选区域的Faster R-CNN目标检测方法,其特征在于,所述步骤S4过程如下:
候选区域优化网络的区域池化RoIpooling层根据候选区域生成网络输出的目标候选区域,对候选区域生成网络的特征映射层输出的特征图进行区域池化,生成固定大小的区域特征,Softmax层输出每个目标候选区域是否包含目标或背景的2分类概率,最后只输出概率大于预设阈值的目标候选区域,即可排除大部分无效候选区域,得到优化后的目标候选区域。
4.根据权利要求2所述的一种基于优化候选区域的Faster R-CNN目标检测方法,其特征在于,所述检测方法在步骤S2之前,还包括Faster R-CNN网络的训练步骤,过程如下:
使用原始Faster R-CNN算法的训练方法训练一个Faster R-CNN网络,首先利用ImageNet预训练模型参数初始化Faster R-CNN网络的卷积特征提取网络和目标分类回归网络的第1层和第2层网络,对其他层采用零均值,标准差为σ的高斯分布随机初始化,然后对Faster R-CNN网络进行端到端的近似联合训练。
5.根据权利要求4所述的一种基于优化候选区域的Faster R-CNN目标检测方法,其特征在于,所述检测方法在步骤S2之前,还包括候选区域优化网络的训练步骤,过程如下:
候选区域优化网络采用零均值,标准差为σ的高斯分布随机初始化,利用训练好的Faster R-CNN网络生成训练数据,单独训练候选区域优化网络,将训练集中的训练图片输入Faster R-CNN网络,候选区域生成网络输出的目标候选区域作为候选区域优化网络的训练数据,与任一标注框的交并比IoU大于THP的目标候选区域,作为正样本,与任一标注框的交并比IoU小于THN的目标候选区域,作为负样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州市长优电子有限公司,未经华南理工大学;广州市长优电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710450440.0/1.html,转载请声明来源钻瓜专利网。