[发明专利]一种基于改进RFBNet算法的行人检测方法及系统在审
申请号: | 202210025310.3 | 申请日: | 2022-01-11 |
公开(公告)号: | CN114495160A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 杨舰;唐玥;李富;彭琪;王军礼;宋耀辉;邱建华 | 申请(专利权)人: | 无锡学院 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/46;G06V20/40;G06V10/764;G06V10/82;G06V10/80;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 颜盈静 |
地址: | 214105 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 rfbnet 算法 行人 检测 方法 系统 | ||
1.一种基于改进RFBNet算法的行人检测方法,其特征在于:包括以下步骤:
步骤1:获取当前帧路面实时图像;
步骤2:将当前帧路面实时图像输入至训练好的RFB_Nano特征提取网络模型中,并使用TensorRT加速引擎运行训练好的RFB_Nano特征提取网络模型,得到当前帧路面实时图像的检测结果,该检测结果包括行人检测框及行人检测框位置信息;
步骤3:判断行人检测框的面积占当前帧路面实时图像面积的比例是否超过阈值,若超过,则发出预警信号,若不超过,则获取下一帧路面实时图像,执行步骤2。
2.根据权利要求1所述的一种基于改进RFBNet算法的行人检测方法,其特征在于:步骤2中,所述的RFB_Nano特征提取网络模型按照以下步骤建立得到:
以VGG16骨架网络模型为特征提取网络的基础,引入RFB模块;
在RFB模块的第一个卷积分支增加一个3*3卷积层;
从第三组卷积层开始,在每组卷积层中的3*3卷积层前增加一层1*1卷积层;
在每一卷积层前插入BN层;
采用多尺度特征融合机制,在conv4_3的特征图的每个单元提取4个default box;在conv7的特征图的每个单元提取4个default box;在conv8_2的特征图的每个单元提取4个default box;在conv9_2的特征图的每个单元提取4个default box;在conv10_2的特征图的每个单元提取4个default box;在conv11_2的特征图的每个单元提取3个default box;
将每一层的卷积核数目削减为原来的一半,且在第三组至第五组卷积层中各去掉一个3*3卷积层,在第五组卷积层中去掉一个最大池化层;
在conv4_3、conv7、conv8_2、conv9_2、conv10_2、conv11_2上通过3*3卷积对取得的各default box进行类别置信度和边界框位置预测。
3.根据权利要求2所述的一种基于改进RFBNet算法的行人检测方法,其特征在于:所述的使用TensorRT加速引擎运行训练好的RFB_Nano特征提取网络模型,具体操作为:
将训练好的RFB_Nano特征提取网络模型通过TensorRT加速引擎中的torch2trt转换器生成可支持TensorRT加速引擎的网络model_trt;
使用TensorRT加速引擎运行网络model_trt,得到当前帧路面实时图像的检测结果。
4.根据权利要求2所述的一种基于改进RFBNet算法的行人检测方法,其特征在于:所述RFB_Nano特征提取网络模型的具体训练操作包括:
按照规则设定defalut box预选框位置以及采用MSRA初始化网络权重;
沿用RFB_Nano模型的SmoothL1Loss作为定位损失,采用类加权交叉熵作为分类损失;采用前向传播和反向传播更新网络权重,使定位损失和分类损失达到最小,得到训练好的RFB_Nano特征提取网络模型。
5.根据权利要求2所述的一种基于改进RFBNet算法的行人检测方法,其特征在于:对于在RFB模块的第一个卷积分支增加的3*3卷积层,其空洞卷积因子为2。
6.一种基于改进RFBNet算法的行人检测系统,其特征在于:包括:
视频获取模块,用于获取路面实时视频数据;
图像处理模块,用于将路面实时视频数据分割为单帧图像,并对单帧图像进行图像预处理,得到当前帧路面实时图像;
行人检测模块,用于将当前帧路面实时图像输入至训练好的RFB_Nano特征提取网络模型中,并使用TensorRT加速引擎运行训练好的RFB_Nano特征提取网络模型,得到当前帧路面实时图像的检测结果,该检测结果包括行人检测框及行人检测框位置信息;
预警模块,用于基于行人检测模块得到的行人检测框,判断行人检测框面积占整张单帧路面实时图像面积的比例是否超过阈值,若超过,则发出预警信号,若不超过,则获取下一帧路面实时图像,调用行人检测模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡学院,未经无锡学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210025310.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:时空矢量光场生成装置及方法
- 下一篇:激光扫描方法、控制方法及系统