[发明专利]人群密度估计方法、装置、电子设备及介质有效
申请号: | 201910750230.2 | 申请日: | 2019-08-14 |
公开(公告)号: | CN110598558B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 王伊飞;黄晓峰;殷海兵;贾惠柱 | 申请(专利权)人: | 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06N3/04;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 311200 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人群 密度 估计 方法 装置 电子设备 介质 | ||
1.一种人群密度估计方法,其特征在于,包括:
获取针对监控区域中人群的监控视频;
提取所述监控视频中图像帧间差异大于预设差分阈值的关键帧;
将所述关键帧输入卷积神经网络模型中进行人群分析,输出所述关键帧对应的人群密度估计图和人数估计结果;
其中,所述卷积神经网络模型是以不同图像及其对应的人群密度估计图和人数估计结果为样本集,经过深度学习训练建立的;
具体的,所述卷积神经网络模型的训练过程如下:
对样本集中的各图像进行预处理,以根据图像中行人所在位置生成对应的人头点图和真实人群密度图;
对预处理后的样本集进行数据增强;
将数据增强后样本集中的图像及与其对应的真值标签共同输入到初始卷积神经网络模型中,输出人群密度估计图,其中,所述初始卷积神经网络模型采用VGG16模型的前十层作为主干网络,模型的初始参数为VGG16模型的预训练权重,将所述图像输入到VGG16前十层网络中,进行特征提取,经过卷积、池化操作得到特征图,该特征图大小为所述图像的1/8,在所述主干网络后面加入空洞卷积网络,将所述特征图使用1*1*1卷积操作,得到大小为所述图像1/8的初始人群密度估计图,将所述初始人群密度估计图通过线性插值法扩大至所述真实人群密度图大小,得到与所述图像大小一致的人群密度估计图;
对所述人群密度估计图的每个像素累加求和,得到人数估计结果;
将欧式距离损失函数和结构相似性损失函数的和确定为所述初始卷积神经网络模型的整体损失函数;所述欧式距离损失函数为人群密度估计图和真实人群密度图的欧氏距离函数,所述结构相似性损失函数为人群密度估计图和真实人群密度图的结构相似性函数;
根据所述整体损失函数确定所述初始卷积神经网络模型的误差;
将所述误差反向传播,调整所述初始卷积神经网络模型的参数,对所述初始卷积神经网络模型进行优化;
重复以上优化步骤,对所述初始卷积神经网络模型进行迭代训练,直到所述整体损失函数收敛,训练完成后得到所述卷积神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述数据增强包括旋转、剪裁、翻转变换、缩放变换、平移变换和噪声扰动。
3.根据权利要求1至2任一项所述的方法,其特征在于,所述提取所述监控视频中图像帧间差异大于预设差分阈值的关键帧,包括:
提取所述监控视频中的第N帧图像和第N-1帧图像,N为大于1的正整数;
将所述第N帧图像和所述第N-1帧图像作减法运算,得到两帧图像间的差分强度;
将所述差分强度大于预设差分阈值的图像帧作为关键帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910750230.2/1.html,转载请声明来源钻瓜专利网。