[发明专利]基于注意力型深度神经网络的人群密度估计方法及装置有效
申请号: | 201911118138.0 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110889343B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 陈宋健;冯瑞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 上海德昭知识产权代理有限公司 31204 | 代理人: | 卢泓宇 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 深度 神经网络 人群 密度 估计 方法 装置 | ||
本发明提供一种基于注意力型深度神经网络的人群密度估计方法,其特征在于,采用基于注意力机制的深度神经网络模型从待测图像中检测出人群密度,包括如下步骤:步骤S1,对待测图像进行预处理获得预处理图像;步骤S2,搭建基于注意力机制的分组扩张深度神经网络模型;步骤S3,根据训练集对分组扩张深度神经网络模型进行训练;步骤S4,将预处理图像输入训练完成的分组扩张深度神经网络模型,从而得出各个预处理图像中的人群密度结果并进行输出,其中,分组扩张深度神经网络模型具有两个模块,包括普通卷积模块以及带有注意力机制的解码卷积模块,解码卷积模块的每一个卷积操作之后都跟着一个通道注意力加成以及一个空间注意力加成。
技术领域
本发明属于计算机视觉以及人工智能技术领域,涉及一种高密度人群场景下的人群密度估计方法及装置,具体涉及一种基于注意力机制的深度神经网络模型的人群密度估计方法及装置。
背景技术
在当前机器学习技术及计算机硬件性能高速提升的情况下,近年来计算机视觉、自然语言处理和语音检测等应用领域取得了突破性进展。人群密度估计作为计算机视觉领域一项基础的任务,其精度也得到了大幅提升。
人群密度估计任务可具体描述如下:
对于拍摄的图片或者录制的视频以及摄像头下的人群场景,生成密度图用以表示单位面积内人群的密度,再以该密度图为基础,将密度图中单位面积人群密度加和,得到最终整体场景的人群密度,或者是整个视频的人群密度变化。
人群密度估计对计算机视觉领域和实际应用具有重要意义,在过去几十年里激励大批研究人员密切关注并投入研究。随着强劲的机器学习理论和特征分析技术的发展,近十几年人群密度估计课题相关的研究活动有增无减,每年都有最新的研究成果和实际应用发表和公布。不仅如此,人群密度估计也被应用到很多实际任务,例如智能视频监控、人群态势分析等。
然而,现有技术的多种人群密度估计方法的检测准确率仍然较低而不能应用于实际通用的估计任务。因此,人群密度估计还远未被完美解决,仍旧是重要的挑战性的研究课题。
为了提高密度估计的准确率,目前常用的方法是增加预测模型训练时的训练数据。然而,一方面,收集大量的训练数据是一件极其困难的工作,另一方面,训练数据量增多也导致模型训练时间延长,甚至有可能然后训练无法实际完成。
发明内容
为解决上述问题,提供一种结构简单、训练消耗少、同时还能保证检测精度的人群密度估计方法及装置,本发明采用了如下技术方案:
本发明提供了一种基于注意力型深度神经网络的人群密度估计方法,用于人群密度的估计,其特征在于,采用基于注意力机制的深度神经网络模型从待测图像中检测出人群密度,包括如下步骤:步骤S1,对待测图像进行预处理获得预处理图像;步骤S2,搭建基于注意力机制的分组扩张深度神经网络模型;步骤S3,把包含多张训练图像的训练集输入搭建好的分组扩张深度神经网络模型从而进行模型训练;步骤S4,将预处理图像输入训练完成的分组扩张深度神经网络模型,从而得出各个预处理图像中的人群密度结果并进行输出,其中,分组扩张深度神经网络模型具有两个模块,包括普通卷积模块以及带有注意力机制的解码卷积模块,解码卷积模块的每一个卷积操作之后都跟着一个通道注意力加成以及一个空间注意力加成。
本发明提供的基于注意力型深度神经网络的人群密度估计方法,还可以具有这样的技术特征,其中,分组扩张深度神经网络模型包含的模型优化器为随机梯度下降,学习率为十的负七次方,步骤S3包括如下子步骤:步骤S3-1,将训练集中的各个训练图像依次输入分组扩张深度神经网络模型并进行一次迭代;步骤S3-2,采用分组扩张深度神经网络模型最后一层的模型参数分别计算出损失误差;步骤S3-3,将损失误差反向传播从而更新分组扩张深度神经网络模型的模型参数;步骤S3-4,重复步骤S3-2至步骤S3-3直至达到训练完成条件,得到训练后的分组扩张深度神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911118138.0/2.html,转载请声明来源钻瓜专利网。