[发明专利]一种YOLO卷积神经网络的人数检测方法在审
申请号: | 202010974637.6 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112036367A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 陈敏;夏圣奎;吉训生;王文郁 | 申请(专利权)人: | 南通天成现代农业科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 226601 江苏省南通*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 yolo 卷积 神经网络 人数 检测 方法 | ||
1.一种YOLO卷积神经网络的人数检测方法,其特征在于,包括以下步骤:
S1、创建标准库文件
通过已标注行人样本训练的YOLO卷积神经网络的网络参数、参考卷积特征和对应的人数,创建标准库文件;
S2、视频帧输入
在接收到截取摄像头拍摄的视频帧,输入截取的视频帧;
S3、轨迹区分
使用DeepSort对YOLOV3的预测框进行轨迹级联匹配,将连续帧图像中的人用不同的轨迹区分开来;
输入跟踪集合Τ={1,…,N},检测集合D={1,…,M},最大阈值Amax;
矩阵С=[Ci,j]存放所有物体跟踪i与物体检测j之间距离的计算结果 ;
矩阵В=[Bi,j]存放所有物体跟踪i与物体检测j之间是否关联的判断(0/1);
关联集合М初始化为Ø;
将找不到匹配的物体检测集合初始化为D;
从刚刚匹配成功的跟踪器循环遍历到最多已经有Amax次没有匹配的跟踪器;
选择满足条件的跟踪器集合 Τn ←{i∈Τ|ai=n};
根据最小成本算法计算出Τn与物体检测j关联成功产生集合 [xi,j];
更新М为匹配成功的M∪{(i,j)|bi,j.xi,j0};
从u中去除已经匹配成功的物体检测j;
循环(3b)到(3f)直到所有视频帧匹配结束;
返回M,u两个集合
S4、统计人数
设定一条检测线,根据行人轨迹通过检测线的方向来确定行人是进入该场所还是离开该场所从而统计人数;
S5、输出含有行人标注框和人数的处理后视频
S51、构建轻量化模型
通过使用ShuffleNet网络替换darknet53网络中的特征提取网络,并且对模型进行了剪枝,显著地优化了模型尺寸和模型计算复杂度,然后使用优化先验框选择方式后的行人检测网络提取行人目标特征,并用交叉熵损失和边界框回归损失计算损失值,在分类基础上结合检测框位置,实现行人检测,并且提出结合行人语义属性的深度学习行人检测方法,优化了锚点框尺寸,考虑到研究目标为行人,行人的边界框一般长与宽在4:1到2:1之间,并且场景中出现不同尺度的目标,因此将三种尺度分别设定为128,256,512,长宽比为2:1,3:1,4:1的共9个锚点框,其中锚点框与真实值边界框的交并比(Intersection Over Union,IOU)大于0.7就标记为正样本,若小于0.3标为负样本;
S52、构建实际模型
根据ShuffleNet通道混洗原理来构建实际模型,通过包含3层的残差单元:1 1卷积和33的depthwise convolution(深度卷积),降低计算量,这里的3 3卷积是瓶颈层,紧接着是11卷积,最后是一个短路连接,将输入直接加到输出上;
将密集的1 1卷积替换成1 1的群卷积,不过在第一个1 1卷积之后增加了一个通道混洗操作;还有就是3 3的depthwise convolution之后没有使用ReLU激活函数;
对原输入采用stride=2的3 3 avg pool,在depthwise convolution处取stride=2保证两个通路尺寸相同,然后将得到特征图与输出进行连接,而不是相加;极致的降低计算量与参数大小;
S53、模型压缩
利用BN层中的缩放因子,在训练过程当中来衡量channel的重要性,将不重要的channel进行删减,达到压缩模型大小,提升运算速度的效果;
当较小时,如(0.001,0.003)时,所对应的channel就会被删减,且非常巧妙的将增加到目标函数中去,达到了一边训练一边剪枝的奇效。
2.根据权利要求1所述的一种YOLO卷积神经网络的人数检测方法,其特征在于,所述步骤S1和S2中设置有库文件创建单元、特征提取单元以及人数判断单元,所述库文件创建单元,用于创建标准库文件,所述标准库文件包括若干参考卷积特征、网络参数和对应的人数;所述特征提取单元,用于接收摄像头拍摄的视频帧,并提取所述视频帧的卷积特征,进而实现人数检测;所述人数判断单元,用于从所述标准库文件中获得与所述视频帧的卷积特征最接近的参考卷积特征并将该参考卷积特征向量对应的人数作为当前场景内的人数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通天成现代农业科技有限公司,未经南通天成现代农业科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010974637.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种稳定型编码器软连接器
- 下一篇:一种飞机用小型故障检测机器人