[发明专利]基于注意力型深度神经网络的人群密度估计方法及装置有效
申请号: | 201911118138.0 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110889343B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 陈宋健;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 卢泓宇 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 深度 神经网络 人群 密度 估计 方法 装置 | ||
1.一种基于注意力型深度神经网络的人群密度估计方法,用于人群密度的估计,其特征在于,采用基于注意力机制的深度神经网络模型从待测图像中检测出人群密度,包括如下步骤:
步骤S1,对所述待测图像进行预处理获得预处理图像;
步骤S2,搭建基于注意力机制的分组扩张深度神经网络模型;
步骤S3,把包含多张训练图像的训练集输入搭建好的所述分组扩张深度神经网络模型从而进行模型训练;
步骤S4,将所述预处理图像输入训练完成的所述分组扩张深度神经网络模型,从而得出各个预处理图像中的人群密度结果并进行输出,
其中,所述分组扩张深度神经网络模型具有两个模块,包括普通卷积模块以及带有注意力机制的解码卷积模块,
所述解码卷积模块的每一个卷积操作之后都跟着一个注意力模块,所述注意力模块由通道注意力以及空间注意力组成,
每个注意力之后都采用sigmoid函数合并操作,
其中,通道注意力获取过程为:对输入至注意力模块的特征图进行最大池化和平均池化后,将最大池化和平均池化得到的两个结果加和,通过所述sigmoid函数从而得到特征图的通道注意力。
2.根据权利要求1所述的基于注意力型深度神经网络的人群密度估计方法,其特征在于:
其中,所述分组扩张深度神经网络模型包含的模型优化器为随机梯度下降,学习率为十的负七次方,
所述步骤S3包括如下子步骤:
步骤S3-1,将所述训练集中的各个所述训练图像依次输入所述分组扩张深度神经网络模型并进行一次迭代;
步骤S3-2,采用所述分组扩张深度神经网络模型最后一层的模型参数分别计算出损失误差;
步骤S3-3,将所述损失误差反向传播从而更新所述分组扩张深度神经网络模型的模型参数;
步骤S3-4,重复步骤S3-2至步骤S3-3直至达到训练完成条件,得到训练后的所述分组扩张深度神经网络模型。
3.根据权利要求1所述的基于注意力型深度神经网络的人群密度估计方法,其特征在于:
其中,所述待测图像为高密度人群图像,
所述步骤S1中进行的所述预处理包括对所述待测图像进行图像分割。
4.根据权利要求3所述的基于注意力型深度神经网络的人群密度估计方法,其特征在于:
其中,所述图像的分割方法为将图像均等分成9份。
5.根据权利要求1所述的基于注意力型深度神经网络的人群密度估计方法,其特征在于:
其中,步骤S1的所述预处理还包括将分割得到的所述图像进行正则化。
6.一种基于注意力型深度神经网络的人群密度估计装置,用于人群密度的估计,其特征在于,采用基于注意力机制的深度神经网络模型从待测图像中检测出人群密度,包括:
预处理部,用于对所述待测图像进行预处理获得预处理图像;
密度预测部,用于从所述预处理图像中预测出人群密度结果并进行输出,该密度预测部包含一个训练好的基于注意力机制的分组扩张深度神经网络模型,
其中,所述分组扩张深度神经网络模型具有两个模块,包括普通卷积模块以及带有注意力机制的解码卷积模块,
所述解码卷积模块的每一个卷积操作之后都跟着一个注意力模块,所述注意力模块由通道注意力以及空间注意力组成,
每个注意力之后都采用sigmoid函数进行合并操作,
其中,通道注意力获取过程为:对输入至注意力模块的特征图进行最大池化和平均池化后,将最大池化和平均池化得到的两个结果加和,通过所述sigmoid函数从而得到特征图的通道注意力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911118138.0/1.html,转载请声明来源钻瓜专利网。