[发明专利]一种基于改进Faster RCNN的行人检测方法有效
申请号: | 202110437461.5 | 申请日: | 2021-04-22 |
公开(公告)号: | CN113052136B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 卞海彤;刘斌 | 申请(专利权)人: | 南京工业大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/25;G06V10/762;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 罗运红 |
地址: | 211816 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 faster rcnn 行人 检测 方法 | ||
1.一种基于改进Faster RCNN的行人检测方法,其特征在于,该方法包括以下步骤:
步骤1:获取行人检测数据样本制作数据集,并进行预处理;
步骤2:训练RPN网络,采用K-means SMOTE算法平衡正负样本,使用RPN网络提取训练集上的候选区域作为Fast R-CNN的训练样本;
步骤3:训练RPN网络和Fast R-CNN网络,共享卷积层特征,获得训练好后的FasterRCNN行人检测模型;
步骤4:将待检测的行人图像输入到训练好后的Faster RCNN行人检测模型,得到最终的检测结果。
2.根据权利要求1所述的一种基于改进Faster RCNN的行人检测方法,其特征在于,步骤1的具体方法如下:
步骤1.1:从Caltech数据集获取行人检测所需的用来训练和检测的数据样本;
步骤1.2:预处理将获取的数据样本转化为标准的VOC数据格式,再生成对应的带标注的文件。
3.根据权利要求1或2所述的一种基于改进Faster RCNN的行人检测方法,其特征在于,步骤2的具体方法如下:
步骤2.1:将训练样本输入到基础网络VGG-16,生成用于RPN网络训练的前景样本和背景样本,具体过程为:
步骤2.1.1:将训练集中的图片通过VGG-16进行特征提取;
步骤2.1.2:对于特征图的每一个点,输出3种尺度和3种长宽比的9个anchors;
步骤2.1.3:对于训练集中的每张图像,通过计算真值区域和anchors的重叠比例,与设置的阈值进行对比,大于阈值的为前景样本,则此anchor为正样本,其余为背景样本,则此anchor为负样本;
步骤2.2:训练RPN时每个mini-batch包含从一张图像中随机提取的256个anchors,此时正负样本不均衡,采用K-means SMOTE算法生成新的正样本来平衡正负样本的具体过程为:
步骤2.2.1:将抽取的256个anchors中心点向量作为一个数据集,将不均衡数据集分为正样本集和负样本集;
步骤2.2.2:对于负样本集Smax,负样本总数为S,通过k-means聚类,簇划分A={A1,A2,...,Aa},划分后每个负样本子簇中心点向量:{μ1,μ2,...,μa},每个负样本子簇的anchor样本数量:{m1,m2,...,ma},a为负样本通过聚类划分的聚类的个数;
步骤2.2.3:对于正样本集Smin,正样本总数为s,通过k-means聚类,簇划分B={B1,B2,...,Bb},划分后每个正样本子簇中心点向量:{λ1,λ2,...,λb},每个正样本子簇的anchor样本数量:{M1,M2,...,Mb},b为正样本通过聚类划分的聚类的个数;
步骤2.2.4:对于每一个正样本子簇,找出所有有效正样本子簇,在这些有效正样本子簇中生成新的正样本,找出所有有效正样本子簇的具体过程为:
步骤2.2.4.1:设有效正样本子簇点数量至少为δ,遍历步骤2.2.3中划分的正样本子簇Bi,i=1,2,...,b,如果Mi<δ,则Bi不是有效正样本子簇,如果Mi≥δ,继续步骤2.2.4.2;
步骤2.2.4.2:设有效正样本子簇中心点与任意负样本子簇中心点的欧式距离不得低于ξ,对于符合步骤2.2.4.1的所有正样本子簇,计算它们的中心点向量λi与所有负样本子簇中心点向量μj欧氏距离,如果dist(λi,μj)<ξ,则Bi不是有效正样本子簇;如果dist(λi,μj)≥ξ,则Bi是有效正样本子簇,j=1,2,...,a;
步骤2.2.4.3:按照以上两个步骤得到k个有效正样本子簇C={C1,C2,...,Ck},对应的每个有效正样本子簇的anchor样本数量:Mm={Mm1,Mm2,...,Mmk};
步骤2.2.5:假设步骤2.2.4中得到的每一个有效正样本子簇Cq对应需要合成的正样本数为nq,满足则
步骤2.2.6:在每个有效正样本子簇中,通过线性插值依次合成nq个新样本,直到每个子簇都生成对应数量的新样本,合成新样本的具体过程为:
步骤2.2.6.1:对于有效正样本子簇Cq中的中心点xq,以欧氏距离为标准计算xq到Cq中所有正样本的距离,按距离由小到大的顺序从Cq中选择xq的w个近邻样本;
步骤2.2.6.2:在w个近邻样本中随机选择nq个样本,记为yu,在xq与yu之间进行随机线性插值,构造新的正样本newu=xq+rand(0,1)*(yu-xq),u=1,2,...,nq;
步骤2.2.6.3:将每个有效正样本子簇中生成的新正样本组成一个新正样本集;
步骤2.2.7:将步骤2.2.6生成的新正样本集加入原来随机抽取的256个anchors样本集组成一个样本均衡的新训练集Snew;
步骤2.3:将平衡样本后的训练集用来训练RPN,利用训练好的RPN网络生成候选框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110437461.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:交易数据查询方法、装置、计算机设备和存储介质
- 下一篇:一种门把手