[发明专利]一种基于双重注意力机制的行人重识别系统有效
申请号: | 202110618743.5 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113392740B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 李玲;沈欣怡;郭润北 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/80;G06V40/10;G06K9/62;G06N3/04 |
代理公司: | 长春吉大专利代理有限责任公司 22201 | 代理人: | 郭佳宁 |
地址: | 130012 吉林省长春市*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双重 注意力 机制 行人 识别 系统 | ||
1.一种基于双重注意力机制的行人重识别系统,其特征在于,在strongbaseline网络基础上插入双重注意力机制模块;其中具体结构如下:
第一层为卷积层,第二层为归一化层,第三层为激活函数层,第四层为池化,接下来是Stage结构,包含Stage1、Stage2、Stage3、Stage4;其中:
在Stage1的Conv Block中第一分支的第二层后面插入双重注意力机制模块,在Stage1的每个Identity Block中第三卷积层后面插入双重注意力机制模块;
在Stage2的Conv Block中第一分支的第三层后面插入双重注意力机制模块,在Stage2的每个Identity Block中第三卷积层后面插入双重注意力机制模块;
在Stage3的Conv Block中第一分支的第三层后面插入双重注意力机制模块,在Stage3的每个Identity Block中第三卷积层后面插入双重注意力机制模块;
在Stage4的Conv Block中第一分支的第三层后面插入双重注意力机制模块,在Stage4的每个Identity Block中第三卷积层后面插入双重注意力机制模块;
最后依次为池化层、归一化层、全连接层和SoftMax分类器;
所述一种基于双重注意力机制的行人重识别系统,其具体结构为:
第一层为卷积层,卷积核数量为64,每个卷积核大小为7*7,第二层为归一化层,第三层为激活函数层,其中激活函数采用Relu激活函数,第四层为池化层,采用最大值池化,池化大小为3*3;
接下来是Stage结构,包含Stage1、Stage2、Stage3、Stage4;其中:
Stage1由Conv Block和2个Identity Block组成,其中Conv Block包含两个分支,第一个分支的第一层为卷积层,卷积核数量为64,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为64,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为256,每个卷积核大小为1*1,将双重注意力机制模块插入该层后面,第二个分支为一层卷积层,卷积核数量为256,每个卷积核大小为1*1;每个分支的每个卷积层后都加入BN层,将得到的特征图进行融合,得到新的输入特征图;Identity Block的第一层为卷积层,卷积核数量为64,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为64,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为256,每个卷积核大小为1*1,且每个卷积层后都加入BN层;将双重注意力机制模块插入每个Identity Block的第三层后面,将该Identity Block的特征图与上一个Block特征进行融合,得到新的输入特征图;
Stage2由Conv Block和3个Identity Block组成,其中Conv Block包含两个分支,第一个分支的第一层为卷积层,卷积核数量为128,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为128,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为512,每个卷积核大小为1*1,将双重注意力机制模块插入该层后面,第二个分支为一层卷积层,卷积核数量为512,每个卷积核大小为1*1;每个分支的每个卷积层后都加入BN层,将特征图进行融合,得到新的输入特征图;Identity Block的第一层为卷积层,卷积核数量为128,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为128,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为512,每个卷积核大小为1*1,且每个卷积层后都加入BN层;将双重注意力机制模块插入每个Identity Block层的第三层后面,将该Identity Block的特征图与上一个Block特征进行融合,得到新的输入特征图;
Stage3由Conv Block和5个Identity Block组成,其中Conv Block包含两个分支,第一个分支的第一层为卷积层,卷积核数量为256,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为256,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为1024,每个卷积核大小为1*1,将双重注意力机制模块插入该层后面,第二个分支为一层卷积层,卷积核数量为1024,每个卷积核大小为1*1;每个分支的每个卷积层后都加入BN层,将两个分支的特征图进行融合,得到新的输入特征图;Identity Block的第一层为卷积层,卷积核数量为256,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为256,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为1024,每个卷积核大小为1*1,且每个卷积层后都加入BN层;将双重注意力机制模块插入每个Identity Block层的第三层后面,将该Identity Block的特征图与上一个Block特征进行融合,得到新的输入特征图;
Stage4由Conv Block和2个Identity Block组成,其中Conv Block包含两个分支,第一个分支的第一层为卷积层,卷积核数量为512,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为512,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为2048,每个卷积核大小为1*1,将双重注意力机制模块插入该层后面,第二个分支为一层卷积层,卷积核数量为2048,每个卷积核大小为1*1;每个分支的每个卷积层后都加入BN层,将两个分支的特征图进行融合,得到新的输入特征图;Identity Block的第一层为卷积层,卷积核数量为512,每个卷积核大小为1*1,第二层为卷积层,卷积核数量为512,每个卷积核大小为3*3,第三层为卷积层,卷积核数量为2048,每个卷积核大小为1*1,且每个卷积层后都加入BN层;将双重注意力机制模块插入每个Identity Block层的第三层后面,将该Identity Block的特征图与上一个Block特征进行融合,得到新的输入特征图;
将得到的特征图依次经过池化层、归一化层、全连接层和SoftMax分类器,SoftMax分类器根据特征对行人类别进行分类,获得图像所属类别;
所述一种基于双重注意力机制的行人重识别系统的训练过程如下:
步骤一,获取公开的行人重识别数据集,并将数据集中的图片尺寸进行归一化操作,使得每张图片的像素尺寸均为256*128;
步骤二,采用ImageNet预训练网络参数初始化基于双重注意力机制的行人重识别系统中strongbaseline网络的参数,引入的双重注意力机制模块则随机初始化参数;
步骤三,将经步骤一处理后的数据集作为训练集输入基于双重注意力机制的行人重识别系统,并让该系统采用反向传播算法和随机梯度下降方法学习训练集中每个行人的特征,最后通过mAP和Rank1这两个指标来评估该系统在行人重识别中的有效性,当mAP和Rank1同时达到最优值时,得到训练好的系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110618743.5/1.html,转载请声明来源钻瓜专利网。