[发明专利]一种基于混合注意力机制的群组行人重识别方法在审
申请号: | 201910827179.0 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110751018A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 杨华;许琪羚 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 31317 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人: | 刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 群组 图像 注意力机制 注意力模型 最小二乘 注意力 卷积神经网络 最小二乘算法 关键区域 特征提取 比对 度量 挑战 多样性 评估 网络 学习 | ||
1.一种基于混合注意力机制的群组行人重识别方法,其特征在于,包括:
S1:基于深度卷积神经网络,形成群组行人重识别任务的骨干模型特征提取网络P,将整个群组行人重识别数据集上的图像对得到的骨干模型特征提取网络P进行应用,对群组行人的每一个图像s,均经过骨干模型特征提取网络P生成特征向量E;
S2:在骨干模型特征提取网络P的基础上,加入混合注意力机制网络H,对已初步提取的特征进行进一步提取;其中,混合注意力机制网络H包括通道注意力模块C和空间注意力模块S,所述通道注意力模块C和空间注意力模块S分别作用于特征向量E不同维度上的特征;
S3:通过混合注意力机制网络H捕获特征向量E的全局依赖,每一个输入的特征向量E分别经过混合注意力机制网络H中的通道注意力模块C和空间注意力模块S处理后得到注意力参数w1和w2,注意力参数w1和w2分别为通道注意力参数和空间注意力参数;
S4:应用S3获得的图像特征经混合注意力机制网络H获得的通道维度和位置维度的注意力参数w1和w2,得到特征向量E的整体注意力权重w;
S5:将特征向量E和注意力权重w相乘,即将群组行人图像特征的通道和位置维度分别乘以注意力参数w1和w2,得到更多地关注群组行人图像的关键区域的特征F;
S6:对已提取的图像特征F与检测目标的特征进行匹配;在距离度量阶段采用最小二乘残差距离,最小二乘残差距离中的检测目标和匹配对象经骨干模型特征提取网络P和混合注意力机制网络H提取后的特征分别为Y和X,通过学习多项式拟合函数来近似接近真实检测目标的特征Y;
所述多项式拟合函数表示为其中A为匹配对象的特征X扩展为矩阵的形式,W为多项式拟合函数的系数;
S7:在多项式拟合函数中加入正则化项;
S8:使用最小二乘法对加入正则化项的多项式拟合函数进行求解,找到最佳的多项式拟合函数的系数W;
S9:将多项式拟合函数的拟合结果与经骨干模型特征提取网络P提取的特征Y的差值构成的函数作为距离对经过混合注意力机制网络H提取的特征X进行比对和评估。
2.根据权利要求1所述的基于混合注意力机制的群组行人重识别方法,其特征是:S1中,所述群组行人重识别任务的骨干模型特征提取网络P主要由深度卷积神经网络组成,输出群组行人的每一个图像s的初步特征。
3.根据权利要求1所述的基于混合注意力机制的群组行人重识别方法,其特征是:S2中,同时采用空间注意力机制和通道注意力机制完成对于群组行人的每一个图像s特征的进一步提取。
4.根据权利要求1所述的基于混合注意力机制的群组行人重识别方法,其特征是:S3中,所述混合注意力机制网络H中:
对于通道注意力模块C,首先对特征向量进行全局池化操作,计算公式如下,
其中,X表示骨干模型特征提取网络P提取的特征,h,w,c分别表示注意力模块C的输入向量在三个维度上的长度;将特征向量进行全局池化后,特征就变成和通道数量一样的长度,同时表示了不同特征通道的注意力权重,然后将全局池化得到的特征向量分别送入两个全连接层;
对于空间注意力模块S,首先在通道维度上对特征向量进行池化,并通过核大小为1×1,步长为1的全连接层用于学习网络在长宽两个维度上的注意力权重;最后将空间注意力和通道注意力的结果作为权重作用于原特征,得到更有分辨力的特征。
5.根据权利要求1所述的基于混合注意力机制的群组行人重识别方法,其特征是:S4中,通道注意力参数w1存在一个维度,空间注意力参数w2存在两个不同维度;将注意力参数w1和w2进行合并后获得在h,w,c三个维度上存在注意力权重的参数w;h,w,c分别表示注意力模块C的输入向量在三个维度上的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910827179.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序