[发明专利]基于级联高分辨卷积神经网络的密集人群计数算法有效
申请号: | 202010170236.5 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111460912B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 张姗姗;姚肇亮;杨健 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 级联 分辨 卷积 神经网络 密集 人群 计数 算法 | ||
1.一种基于级联高分辨卷积神经网络的密集人群计数算法,其特征在于,包括如下步骤:
步骤1、利用几何自适应高斯响应技术GAK估计密集人群图像中单个人头的尺度大小,据此生成二维高斯响应密度图像作为密度图像估计真值Dt,用于监督预测密度图像Dp,并确保每个人头高斯响应像素值累加和为一,具体为:
先计算当前人头xi与其周围最近邻k个人头的平均距离高斯核函数的方差由平均距离乘以比例系数β得到,即从而包含M个人头的图像其对应的监督密度图Dp可由以高斯函数为核函数进行逐个人头卷积以后得到:
其中,M为人头总个数,x为Dp内当前像素,δ(·)为狄拉克函数,为方差为σi的高斯函数;
步骤2、利用初级高分辨率特征提取网络HRNet提取输入图像的高分辨率特征,具体为:
HRNet首先使用两个卷积操作将输入图像的特征下采样到原图尺度的四分之一大小,然后输入图像特征到网络主干当中进行多分辨率并行融合,同时使所提取的特征维持在输入图像四分之一尺寸大小的分辨水平;
步骤3、利用步骤2输出的高分辨特征预测初级密集人群密度图Dp1,在Dp1基础上使用MSE损失函数对HRNet网络参数进行优化;
步骤4、基于初级高分辨特征提取网络HRNet,构建级联高分辨特征提取网络CHRNet提取第二级高分辨特征,与HRNet不同,CHRNet在密度图估计分支上进行级联,将高分辨率特征和Dp1联合作为级联分支的输入特征;
步骤5、采用分区域损失加权的方式,使用MSE和计数误差两种损失函数进行网络参数优化,具体为:对真值密度图和预测密度图进行区域划分,计算每个子区域对应的MSE损失和计数损失,再通过加权方式组合成新的损失函数,从而对步骤4构建的CHRNet网络参数进行优化;
步骤6、利用第二级高分辨特征预测最终密集人群密度图Dp2,Dp2的输入是CHRNet的高分辨率特征和第一级输出Dp1;
步骤7、利用最终密集人群密度图,对密度图像素值进行累加求和,得到最终密集人群计数结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010170236.5/1.html,转载请声明来源钻瓜专利网。