[发明专利]一种基于深度学习的人群计数模型及其实现方法有效
申请号: | 201910772643.0 | 申请日: | 2019-08-21 |
公开(公告)号: | CN110705344B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 林倞;甄家杰;刘凌波;李冠彬 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V20/40;G06V10/774;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 广州容大知识产权代理事务所(普通合伙) 44326 | 代理人: | 刘新年 |
地址: | 510275 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 人群 计数 模型 及其 实现 方法 | ||
本发明公开了一种基于深度学习的人群计数模型及其实现方法,所述方法包括:步骤S1,获取人群图像,对获取的人群图像进行预处理并利用标注信息产生对应的人群密度图;步骤S2,将输入的人群图像缩放成多个尺度版本,通过多个子网络提取各个尺度的特征,并利用特征增强模块增强各个尺度的特征;步骤S3,将多个子网络产生的特征结合,生成估计的人群密度图;步骤S4,利用估计的人群密度图与真实的人群密度图计算损失,更新模型参数;步骤S5,利用不同人群图像多次迭代式地进行步骤S1‑S4的训练过程,直到符合停止的条件。
技术领域
本发明涉及基于深度学习的计算机视觉技术领域,特别是涉及一种基于深度学习的人群计数模型及其实现方法。
背景技术
人群计数是计算机视觉中的一个重要研究课题,其目标是根据人群图像自动生成人群密度图并估计场景中的人数。最近,由于其广泛的实际应用,例如视频监控、交通管理和人群流量预测,这项任务在学术界和工业界都受到越来越多的关注。
传统的人群计数算法一般需要对图像进行复杂的预处理,并且需要人工设计和提取特征,在跨场景的情况下往往需要重新提取特征,适应性较差。近几年,卷积神经网络的成功运用为人群计数技术带来了重大突破,C.Zhang等人在2015年的研究工作“Cross-scene Crowd Counting via Deep Convolutional Neural Networks”(IEEE Conferenceon Computer Vision and Pattern Recognition(CVPR),June 2015)提出一个适用人群计数的卷积神经网络模型,其实现了端对端训练,无需进行前景分割以及人为地设计和提取特征,经过多层卷积之后得到高层特征,提高在跨场景人群计数的性能。然而,在不同的拥挤场景中,人群规模差异很大,同一图象中因距离摄像头距离不同人群的密度和分布也存在差异,该类方法无法捕捉如此巨大的规模变化。
为了解决人群规模变化的问题,一些研究工作的关注点放在了提取多个不同尺度的特征以减少规模变化的影响,例如Y.Zhang等人在2016年的研究工作“Single-ImageCrowd Counting via Multi-Column Convolutional Neural Network”(IEEE Conferenceon Computer Vision and Pattern Recognition(CVPR),June 2016)和X.Cao等人在2018年的研究工作“Scale Aggregation Network for Accurate and Efficient CrowdCounting”(Proceedings of the European Conference on Computer Vision(ECCV),2018),均通过提取多个不同尺度的特征以减少规模变化,然而,这些方法大多采用简单的策略来融合多个特征,不能很好地捕获不同尺度的特征之间的互补信息。人群在不同场景下的规模差异问题仍未得到完全解决。
发明内容
为克服上述现有技术存在的不足,本发明之目的在于提供一种基于深度学习的人群计数模型及其实现方法,以解决现有技术在不同场景下的人群规模差异问题。
为达上述目的,本发明提出一种基于深度学习的人群计数模型,包括:
预处理单元,用于获取人群图像,对获取的人群图像进行预处理后输出至特征提取单元,并利用标注信息产生对应的人群密度图;
特征提取单元,用于将输入的人群图像缩放成多个尺度版本,通过多个子网络提取各个尺度的特征,并利用特征增强模块增强各个尺度的特征;
估计人群密度图生成单元,用于将多个子网络产生的特征结合,生成估计的人群密度图;
更新单元,用于使用所述估计人群密度图生成单元生成的估计的人群密度图与所述预处理单元生成的真实人群密度图计算损失,更新模型参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910772643.0/2.html,转载请声明来源钻瓜专利网。