[发明专利]一种基于深度学习的人数估计方法有效
申请号: | 201710862828.1 | 申请日: | 2017-09-22 |
公开(公告)号: | CN107657226B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 解梅;秦方;李佩伦;苏星霖 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人数 估计 方法 | ||
1.一种基于深度学习的人数估计方法,其特征在于,包括下列步骤:
构建深度神经网络模型:
基于10个卷积层和2个池化层的单列卷积神经网络,其中前6个卷积层的卷积核大小均为5x5,第7~9个卷积层的卷积核大小均为3x3,最后一个卷积层的卷积核大小为1x1;2个池化层的池化方式采用最大池化,且池化核大小均为2x2;
准备训练数据:
采用人数统计领域常用的人数统计数据库UCSD、Shanghaitech PartA与ShanghaitechPartB,样本的标注信息为图像样本中的人头位置信息(x,y),即人头中心像素在图像中的坐标;然后根据该人头坐标计算密度图作为网络的标签信息,并利用Caffe框架下的工具将样本图像和标签信息生成LMDB数据文件,包括训练数据和测试数据;
计算密度图:根据训练图像样本中的人头位置信息,计算样本的基于高斯核的密度图;基于几何适应高斯核的密度图的计算为:其中,δ(x-xi)为图像中人头位置的冲击函数,xi为人头位置向量,即人头位置信息(x,y),N为人头总数,G为高斯核;
基于训练样数据对所构建的深度神经网络模型进行训练,获得训练好的深度神经网络模型:
利用Caffe框架将生成的训练数据和测试数据,以及构建的深度神经网络模型的网络文件载入Caffe的训练执行过程,通过网络的前向计算,以及损失函数L(Θ)计算网络误差,并将该误差反向传播,计算网络每一层权重的误差梯度,并进行权值更新,逐渐缩小网络误差值;不断循环执行该过程,寻找最有效的网络训练参数,使得网络损失降低至最小或者降至符合要求的值;其中,所述深度神经网络模型的损失函数其中为网络前向计算所得到的密度图,M为训练样本数目,Fn为输入图像根据公式计算得到的真实密度图F(x),即输入网络的标签信息;
且训练时,一次训练样本所选取的样本数batch size设置为1,学习率base_lr设置为1e-7,获得训练好的深度神经网络模型的训练迭代次数为80万次;
将待估计图像输入训练好的深度神经网络模型中,得到待估计图像的估计密度图,对所述估计密度图进行积分,得到待估计图像的估计人数;
将训练好的深度神经网络模型在人数统计数据库UCSD、Shanghaitech PartA与Shanghaitech PartB进行测试,各人数统计数据库所对应的平均绝对误差和均方误差具体为:
人数统计数据库UCSD的平均绝对误差和均方误差分别为:1.03、1.21;
人数统计数据库Shanghaitech PartA的平均绝对误差和均方误差分别为:109.05、170.38;
人数统计数据库Shanghaitech PartB的平均绝对误差和均方误差分别为26.04、42.1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710862828.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种立式中频淬火机床用淬火感应器
- 下一篇:一种光轴加工设备