[发明专利]一种基于双摄头的列车车厢人群密度估计方法有效
申请号: | 201810408662.0 | 申请日: | 2018-04-28 |
公开(公告)号: | CN110414301B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 陈汉嵘;谢晓华;韦宝典 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/764;G06V10/82;G06N3/0464;G06N3/047;G06N3/048;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双摄头 列车 车厢 人群 密度 估计 方法 | ||
1.一种基于双摄头的列车车厢人群密度估计方法,其特征在于,包括如下步骤:
S10准备训练样本:建立包含4个参数共享的卷积层和5个全连接层的神经网络,输入同一车厢内相同时刻的两个不同视角的视频帧,训练具有密度等级的标签的样本,其中卷积层用于提取视频的特征向量,全连接层用于将卷积层所提取出的特征向量按密度等级进行分类;
所述5个全连接层包括FC5、FC6、FC7、FC8和Softmax层,第四个Conv层输出双摄头的两张36×58×8的特征图,分别输入到全连接层FC5_0和FC5_1,得到两组1024维的特征向量;两组向量分别输入到FC6_0层和FC6_1层得到两组512维的特征向量,接着两组512维的特征向量进行相加操作得到新的一组512维特征向量;该新的一组512维特征向量输入到FC7层得到256维的特征向量;再将该256维的特征向量输入到FC8层得到128维的特征向量;最后将该128维的特征向量输入到Softmax层得到一组5维的概率向量;
S20神经网络训练:数次迭代优化训练神经网络;
S30应用阶段:截取双摄头拍摄的当前列车车厢的视频帧分别输入至优化后的神经网络,将两视频帧进行加权融合,得到当前列车车厢的图像分类结果,计算公式如下:
class=argmax{[F(X1;θ)+F(X2;θ)]/2}
其中F(Xi;θ)为网络模型的输出,X1,X2分别为两个摄像头输入的图像,θ为收敛模型的参数。
2.如权利要求1所述的基于双摄头的列车车厢人群密度估计方法,其特征在于,所述S10中所述4个参数共享的卷积层包括第一Conv层、第二Conv层、第三Conv层和第四Conv层,所述第一Conv层的卷积核大小为9×9,步长为1,卷积核数目是16个,图像输入第一Conv层生成16个特征图,接上线性整流函数Relu层和最大值池化Max-pooling层后,输出大小为288×464×16的特征图。
3.如权利要求2所述的基于双摄头的列车车厢人群密度估计方法,其特征在于,所述第二Conv层的卷积核大小为7×7,步长为1,卷积核数目是32个,图像输入第二Conv层生成32个特征图,接上Relu层和Max-pooling层,输出大小为144×232×32的特征图。
4.如权利要求2所述的基于双摄头的列车车厢人群密度估计方法,其特征在于,所述第三Conv层的卷积核大小为7×7,步长为1,卷积核数目是16个,图像输入第三Conv层生成16个特征图,再接上Relu层和Max-pooling层,输出大小为72×116×16的特征图。
5.如权利要求2所述的基于双摄头的列车车厢人群密度估计方法,其特征在于,所述第四个Conv层的卷积核大小为7×7,步长为1,卷积核数目是8个,图像输入第四Conv层生成8个特征图,接上Relu层和Max-pooling层,输出大小为36×58×8的特征图。
6.如权利要求1所述的基于双摄头的列车车厢人群密度估计方法,其特征在于,所述密度等级包括ex-low、low、medium、high、ex-high,所述ex-low的样本标签为[1,0,0,0,0],所述low的样本标签为[0,1,0,0,0],所述medium的样本标签为[0,0,1,0,0],所述high的样本标签为[0,0,0,1,0],所述ex-high的样本标签为[0,0,0,0,1],根据最后一层输出值大小判定图像的人群密度等级。
7.如权利要求1所述的基于双摄头的列车车厢人群密度估计方法,其特征在于,所述S20具体包括:
S201设置神经网络的每个batch为一预定值,每次迭代输入该预定值数的样本;
S202采用gaussian初始化神经网络卷积层的参数,采用xavier方法初始化全连接层参数,所述gaussian是高斯分布初始化为W~N(μ,σ2),其中μ=0,σ2=0.01,所述xavier是将参数以均匀分布的方式初始化,具体为其中n表示参数所在层的输入维度,m则表示输出维度;
S203使用Adam算法进行优化训练,其中Adam算法的公式如下:
参数更新规则:
上式中,表示第t次迭代的梯度,β1,β2是超参数,一般设置为0.9和0.999,∈是一个很小的数值以防分母为零,一般设置成10-8,mt近似看做是对的期望,vt近似看做对的期望,而和则分别是对mt和vt的无偏差估计;
S204利用损失函数Softmax迭代神经网络数次,直至达到最优,所述损失函数Softmax的公式如下:
其中,左项是交叉熵代价函数,[f1,f2,…,fK]为网络的输出向量,在本任务中K=5,yi表示为此次迭代中第i个样本所对应的等级密度,右项R(W)是正则项,W表示网络参数,λ是超参数,设置为0.0002。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810408662.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:虹膜特征的合成方法和装置
- 下一篇:非接触式的瞳距测量方法及系统