[发明专利]一种基于深度学习人头检测的密集人流量统计方法有效
申请号: | 201711403665.7 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108154110B | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 任俊芬 | 申请(专利权)人: | 任俊芬 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 北京科名专利代理有限公司 11468 | 代理人: | 陈朝阳 |
地址: | 054000 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人头 检测 密集 人流量 统计 方法 | ||
1.一种基于深度学习人头检测的密集人流量统计方法,其特征在于,包括如下步骤:
步骤一)人工收集监控场景的监控录像,在监控录像中用人头框标注场景人头数据,利用深度学习框架建立人头检测的深度残差卷积神经网络,并且对神经网络进行训练;对神经网络进行训练的方法为:先对图像数据做数据增强,再将增强后的图像数据输入神经网络,迭代训练神经网络;
步骤二)将监控录像逐帧实时输入训练好的深度残差卷积神经网络,得到监控视频每帧中的所有人头框;
步骤三)对于当前帧图片,判断图片中每个人头框是否已被加总统计过,若当前帧没有人头框则转至步骤二);
步骤四)将步骤三)中判断为未统计过的人头框进行逐帧跟踪判断,若确认为有效的人头则加总至人头总数,否则舍弃该人头框;
所述步骤一)中,深度残差卷积神经网络包括15层主干网络和三个输出支路:主干网络包含15个卷积层,卷积核大小均为3×3,分别在第1层、第2层和第11层卷积层步长为2,其余卷积层步长为1;按残差结构要求,每两个步长为1的卷积层添加一个跳连结构;每层卷积后使用线性修正单元ReLU函数进行激活;3个输出支路各自含有3个卷积层,分别连接在主干网络第10层、第13层、第15层,卷积核大小均为1×1,步长为1;除最后一层外,每层卷积后使用线性修正单元ReLU函数进行激活。
2.如权利要求1所述的一种基于深度学习人头检测的密集人流量统计方法,其特征在于,所述步骤一)中,对神经网络进行训练的方法具体为:
1)对图像数据做数据增强:神经网络根据人工标注信息,选取某个人头所对应的框,其高和宽分别记为H和W;选取一个20至150间的随机数x,并把原图按照比例x/max(H,W)进行放缩;再对图像中每个像素乘以一个0.5至2之间的随机数,并与255取小;
2)将所获得的增强后的图片图像数据拷贝至一个全0三通道图片,使所选人头框的中心对准该全0彩色图片中心,并舍去原图其余的部分,再将图片传入网络;
3)根据人工标注信息计算定位损失的L2范数和置信度损失的L2范数,利用梯度反向传播方法迭代优化网络参数,直至迭代1000000次。
3.如权利要求1所述的一种基于深度学习人头检测的密集人流量统计方法,其特征在于,所述步骤三)中,建立人头框跟踪列表和用于步骤四)判断的临时列表,将当前帧检测到的人头框与跟踪列表里的人头框用卡尔曼滤波进行匹配更新;如果当前图片没有检测到人头,则转至步骤二);若所有框都已经加总统计过,则转至步骤二);若存在未被计数的人头框,将这些人头框置于临时列表送入步骤四)。
4.如权利要求1所述的一种基于深度学习人头检测的密集人流量统计方法,其特征在于,所述步骤四)临时列表中的人头框用卡尔曼滤波跟踪10帧,如果超过5帧该人头框都可以被检测到则将其加总至人流计数,否则就忽略该框,同时将其从临时列表里清除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于任俊芬,未经任俊芬许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711403665.7/1.html,转载请声明来源钻瓜专利网。