[发明专利]一种基于多尺度特征融合的人群计数方法有效

申请号：	202110238683.4	申请日：	2021-03-04
公开（公告）号：	CN112597985B	公开（公告）日：	2021-07-02
发明（设计）人：	黄进;杨旭;张志鸿	申请（专利权）人：	成都西交智汇大数据科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司：	成都点睛专利代理事务所(普通合伙) 51232	代理人：	葛启函
地址：	610000 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于尺度特征融合人群计数方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于神经网络技术领域，具体的说是涉及一种基于多尺度特征融合的人群计数方法。本发明主要方法是：从骨干网络中提取出三个尺度的特征图，送入特征融合子网络，利用融合后的特征图计算密度图，从而预测图像中的人群数量。其中特征融合子网络设计为三个卷积网络分支，每个分支的结构相同，都采用注意力融合网络，分为两路，每一路由卷积层、归一化层和激活函数构成，两路的输入相同，输出通道数不同，分别是单通道和N通道，单通道的分支学习了多通道输出分支的特征权重，将其与多通道输出特征图输出相乘，最后叠加三个大分支的特征图，共同送入一个解码模块输出图像密度图，密度图积分值即为图像中的人群数量。本发明提高了人数统计的精度。

技术领域

本发明属于神经网络技术领域，具体的说是涉及一种基于多尺度特征融合的人群计数方法。

背景技术

人群计数是通过算法自动统计图像场景中的目标人数，这项方法被广泛地用于视频监控、安防等领域。尤其是在商场、车站、景点等公共场所，进行实时人数估计有助于对拥挤情况的分析和异常状况的监测，可以有效保障安全问题。目前主流的人群计数方法都是基于密度图回归，即通过预测一个图像密度图来估计人数。其简要步骤可以描述为，将场景图片送入网络模型，输出密度图，统计密度图的积分值。现有人群计数算法存在的主要缺陷在于密集场景的检测。在密集场景下，人头目标像素范围小，很难准确的统计到每个目标。

现有技术存在的主要问题及缺陷为：

（1）采用多列网络计算的特征冗余。这一问题体现在对网络采用多列分支计算的时候，各个分支的类似性，带来巨大的参数量的同时，也有很多的特征冗余，同时这种结构训练耗时长，不容易收敛，各分支的结果大同小异，很难起到区分不同尺度信息的作用。

（2）对多尺度信息的使用不全面。多列网络试图通过不同的分支提取不同尺度的信息，但是由于多列网络的设计困难和分支相似性太高，导致各列分支信息差异不大，因此利用各个分支表示不同尺度的图像特征效果不太好。而单列网络，高层的特征使用较为充分，但是低层的特征有很多又被丢失。

解决以上问题及缺陷的难度为：现有的网络设计单纯采用多列或单列结构，二者优点不能兼顾，多列分支的目的是提取不同尺度信息，但限于本身设计困难，很难达到较好的提取多尺度信息，单列可以提取更深层次的信息，但是对低层信息丢失过于严重，因此可以设计一种结构兼容两种方法的优点，实现对多尺度信息的有效利用。

发明内容

本发明针对上述问题，为了解决密集和小目标难以检测的问题，从特征融合的角度提升算法精度，从而提出的一种多尺度特征融合的人群计数方法。

本发明的技术方案是：

一种基于多尺度特征融合的人群计数方法，如图1所示，包括以下步骤：

S1、制作训练数据集：获取场景图像，不同图像中具有不同密集度的人群，对每张图像中人头中心点进行标记，获得实际密度图，将所获得的实际密度图作为训练数据集；获取图像的方法可以从网络上下载公开图像，或者按照需求，自己收集某个场景下的图片，尽可能保证图像的差异性，稀疏和密集场景的人群图像都需要采集，对图像进行标注，制作实际密度图。标注图像时只需标记图像的人头中心点，实际密度图是通过对图像的人头中心点进行高斯滤波处理得到；

S2、构建神经网络模型：采用骨干网络、特征融合网络和解码模块构成神经网络模型；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于成都西交智汇大数据科技有限公司，未经成都西交智汇大数据科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110238683.4/2.html，转载请声明来源钻瓜专利网。

上一篇：一种可远程控制的化学化工用反应釜
下一篇：一种工业部件视觉多目标鲁棒模板获取的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多尺度特征融合的人群计数方法有效

专利文献下载