[发明专利]一种基于人体表观结构的人群数量预测方法有效
| 申请号: | 201611225785.8 | 申请日: | 2016-12-27 |
| 公开(公告)号: | CN106815563B | 公开(公告)日: | 2020-06-02 |
| 发明(设计)人: | 黄思羽;张仲非;李玺 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/34;G06N3/08 |
| 代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 李琳 |
| 地址: | 310027 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 人体 表观 结构 人群 数量 预测 方法 | ||
本发明公开了一种基于人体表观结构的人群数量预测方法,用于预测给定场景图像里的人群数量。具体包括如下步骤:获取用于训练人群数量预测模型的监控图像数据集,并定义算法目标;对监控图像数据集中行人身体的表观语义结构进行建模,并对行人的密度分布和身体形状进行联合建模;根据步骤S2中的建模结果建立人群数量的预测模型;使用所述预测模型预测场景图像中的人群数量。本发明适用于真实视频监控场景中的人群数量预测,面对各类复杂情况具有较佳的效果和鲁棒性。
技术领域
本发明属于计算机视觉领域,特别地涉及一种基于人体表观结构的人群数量预测方法。
背景技术
20世纪末以来,随着计算机视觉的发展,智能视频监控技术得到广泛的关注和研究。人群计数是其中一项重要和具有挑战性的任务,其目标是准确预测高密度人群图像中的行人数量。人群计数任务的的三个关键因素是行人、头部以及它们的上下文结构。当我们人类在统计人群的数量时,我们会利用行人身体不同部分的语义结构作为线索来准确判断每个人的位置。因此,准确地预测人群数量需要对行人身体的语义结构进行分析。
现有的人群计数方法通常包含如下三类:1、基于行人检测器的人群计数。这类方法利用各种行人检测器来匹配图像中的每个行人;2、基于全局回归的人群计数。这类方法主要建模人群图像与人群数量之间的映射;3、基于密度估计的人群计数。这类方法建模人群的密度分布,再通过密度分布预测人群数量。现有的方法将行人的整个身体作为一个整体建模,或者仅建模行人的头部。它们忽略了丰富的行人身体部分的语义结构信息,利用这些结构信息可以提高人群计数算法的性能。
发明内容
为解决上述问题,本发明的目的在于提供一种基于人体表观结构的人群数量预测方法,用于预测给定场景图像里的人群数量。本方法基于深度神经网络对行人的身体表观结构和密度分布信息进行语义建模,并根据建模结果预测准确的人群数量,能够更好地适应真实视频监控场景中的复杂情况。
为实现上述目的,本发明的技术方案为:
一种基于人体表观结构的人群数量预测方法,包括以下步骤:
S1、获取用于训练人群数量预测模型的监控图像数据集,并定义算法目标;
S2、对监控图像数据集中行人身体的表观语义结构进行建模,并对行人的密度分布和身体形状进行联合建模;
S3、根据步骤S2中的建模结果建立人群数量的预测模型;
S4、使用所述预测模型预测场景图像中的人群数量。
进一步的,步骤S1中,所述的用于训练人群数量预测模型的监控图像数据集,包括场景图像人工标注的行人头部位置Ptrain和场景深度图
定义算法目标为:预测一幅场景图像中的行人数量
进一步的,步骤S2中,对行人身体的表观语义结构进行建模具体包括:
S21、根据监控图像数据集中所有行人头部位置Ptrain及其各自的场景深度值确定每个行人图像边界框的位置和大小,以此从场景图像集中裁剪得行人图像Itrain;
S22、将行人图像Itrain分别输入单个行人语义分割系统进行语义分割;
S23、对每幅场景图像将其中所有行人的分割结果按原尺寸和位置还原,得到场景图像的人群语义结构图反映场景图像中所有行人的身体部分的语义结构信息。
进一步的,步骤S2中,对行人的密度分布和身体形状的联合建模具体包括:
S24、对场景图像中的行人的密度分布和身体形状进行联合建模,得到结构化人群密度图
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611225785.8/2.html,转载请声明来源钻瓜专利网。





