[发明专利]一种基于多尺度特征融合的人群计数方法有效
申请号: | 202110238683.4 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112597985B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 黄进;杨旭;张志鸿 | 申请(专利权)人: | 成都西交智汇大数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都点睛专利代理事务所(普通合伙) 51232 | 代理人: | 葛启函 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 特征 融合 人群 计数 方法 | ||
本发明属于神经网络技术领域,具体的说是涉及一种基于多尺度特征融合的人群计数方法。本发明主要方法是:从骨干网络中提取出三个尺度的特征图,送入特征融合子网络,利用融合后的特征图计算密度图,从而预测图像中的人群数量。其中特征融合子网络设计为三个卷积网络分支,每个分支的结构相同,都采用注意力融合网络,分为两路,每一路由卷积层、归一化层和激活函数构成,两路的输入相同,输出通道数不同,分别是单通道和N通道,单通道的分支学习了多通道输出分支的特征权重,将其与多通道输出特征图输出相乘,最后叠加三个大分支的特征图,共同送入一个解码模块输出图像密度图,密度图积分值即为图像中的人群数量。本发明提高了人数统计的精度。
技术领域
本发明属于神经网络技术领域,具体的说是涉及一种基于多尺度特征融合的人群计数方法。
背景技术
人群计数是通过算法自动统计图像场景中的目标人数,这项方法被广泛地用于视频监控、安防等领域。尤其是在商场、车站、景点等公共场所,进行实时人数估计有助于对拥挤情况的分析和异常状况的监测,可以有效保障安全问题。目前主流的人群计数方法都是基于密度图回归,即通过预测一个图像密度图来估计人数。其简要步骤可以描述为,将场景图片送入网络模型,输出密度图,统计密度图的积分值。现有人群计数算法存在的主要缺陷在于密集场景的检测。在密集场景下,人头目标像素范围小,很难准确的统计到每个目标。
现有技术存在的主要问题及缺陷为:
(1)采用多列网络计算的特征冗余。这一问题体现在对网络采用多列分支计算的时候,各个分支的类似性,带来巨大的参数量的同时,也有很多的特征冗余,同时这种结构训练耗时长,不容易收敛,各分支的结果大同小异,很难起到区分不同尺度信息的作用。
(2)对多尺度信息的使用不全面。多列网络试图通过不同的分支提取不同尺度的信息,但是由于多列网络的设计困难和分支相似性太高,导致各列分支信息差异不大,因此利用各个分支表示不同尺度的图像特征效果不太好。而单列网络,高层的特征使用较为充分,但是低层的特征有很多又被丢失。
解决以上问题及缺陷的难度为:现有的网络设计单纯采用多列或单列结构,二者优点不能兼顾,多列分支的目的是提取不同尺度信息,但限于本身设计困难,很难达到较好的提取多尺度信息,单列可以提取更深层次的信息,但是对低层信息丢失过于严重,因此可以设计一种结构兼容两种方法的优点,实现对多尺度信息的有效利用。
发明内容
本发明针对上述问题,为了解决密集和小目标难以检测的问题,从特征融合的角度提升算法精度,从而提出的一种多尺度特征融合的人群计数方法。
本发明的技术方案是:
一种基于多尺度特征融合的人群计数方法,如图1所示,包括以下步骤:
S1、制作训练数据集:获取场景图像,不同图像中具有不同密集度的人群,对每张图像中人头中心点进行标记,获得实际密度图,将所获得的实际密度图作为训练数据集;获取图像的方法可以从网络上下载公开图像,或者按照需求,自己收集某个场景下的图片,尽可能保证图像的差异性,稀疏和密集场景的人群图像都需要采集,对图像进行标注,制作实际密度图。标注图像时只需标记图像的人头中心点,实际密度图是通过对图像的人头中心点进行高斯滤波处理得到;
S2、构建神经网络模型:采用骨干网络、特征融合网络和解码模块构成神经网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都西交智汇大数据科技有限公司,未经成都西交智汇大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110238683.4/2.html,转载请声明来源钻瓜专利网。