[发明专利]用于拥挤人群计数的自适应多尺度上下文聚合方法在审
申请号: | 202110242403.7 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112966600A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 赵怀林;梁兰军;张亚妮;周方波 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 拥挤 人群 计数 自适应 尺度 上下文 聚合 方法 | ||
1.一种用于拥挤人群计数的自适应多尺度上下文聚合方法,其特征在于,包括:
步骤1:将样本图片输入到主干网络,提取大小为输入图像分辨率j倍的特征图;
步骤2:将提取的特征图以级联的形式输入到多个多尺度上下文聚合模块,提取并自适应聚合多尺度上下文信息,得到多尺度上下文特征;其中,每个多尺度上下文聚合模块的后面均设有一个上采样层,所述上采样层用于将多尺度上下文特征转为更高分辨率的特征图;
步骤3:对生成的多尺度上下文特征进行卷积层处理,生成密度图;
步骤4:计算生成的密度图与真值密度图之间的损失函数,对网络参数进行优化;
步骤5:对所述生成的密度图进行积分求和,得到预测人数。
2.根据权利要求1所述的用于拥挤人群计数的自适应多尺度上下文聚合方法,其特征在于,所述步骤4包括:
根据有人头标注点的图片,通过高斯核卷积生成人群的真值密度图,所述密度图的计算公式如下:
其中,Fi(x)表示真值密度图,xi表示有人头的像素点,Gσ表示高斯核,δ(·)表示狄拉克函数,σ是标准差,N代表图片的总人数,x表示图片的像素点。
3.根据权利要求1所述的用于拥挤人群计数的自适应多尺度上下文聚合方法,其特征在于,所述步骤2包括:
多尺度上下文聚合模块自适应选择小尺度上下文特征,并将所述小尺度上下文特征与大尺度上下文特征进行聚合;所述多尺度上下文聚合模块包括多个空洞率不同的空洞卷积的分支;
采用来表示通过第i个尺度的空洞卷积提取的特征;其中,i表示卷积核的空洞率,表示分辨率是输入图像的分辨率的j倍,r表示指主干网络的缩减率,表示第i个尺度的空洞卷积提取的特征图,且所述特征图分辨率为原来的j倍;W×H表示图像的分辨率,C表示图像的通道数,R表示j倍分辨率的所有特征图的集合;
将空洞卷积提取的特征图输入到通道注意力模块中,所述通道注意力模块采用一个选择函数f自适应的选择中有用的上下文特征信息,并输出聚合了上下文信息的特征图Yj∈RjW×jH×C,其中Yj定义如下:
Yj表示通过聚合模块提取的j倍分辨率的特征图,表示逐个元素求和,表示提取第1个尺度的特征图,表示提取第2个尺度的特征图,表示提取第3个尺度的特征图,表示提取第n个尺度的特征图,j表示分辨率是输入图片的分辨率的j倍。
4.根据权利要求3所述的用于拥挤人群计数的自适应多尺度上下文聚合方法,其特征在于,所述采用一个选择函数f自适应的选择中有用的上下文特征信息,包括:
将每一个上下文特征通过一个全局空间平均池化层进行池化处理,输出特征信息
采用由两个完全连接的层组成瓶颈结构对特征信息Favg进行处理,并通过sigmoid函数将输出特征归一化为(0,1),其中,自适应输出系数的计算公式如下:
式中:和分别表示两个全连接层的权重系数,其中第一个全连接层的后面有一个RELU函数,第二个全连接层的后面采用一个Sigmoid函数,表示通过平均池化层后的输出;
在通道注意力机制的输入和输出之间加入残差连接,得到选择函数定义如下:
式中:表示第i个通道注意力机制模块的输出,表示表示第i个尺度的空洞卷积提取的特征图,表示第i个通道注意力机制模块的自适应系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110242403.7/1.html,转载请声明来源钻瓜专利网。