[发明专利]一种基于混合注意力机制的群组行人重识别方法在审
申请号: | 201910827179.0 | 申请日: | 2019-09-03 |
公开(公告)号: | CN110751018A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 杨华;许琪羚 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 31317 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人: | 刘翠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于混合注意力机制的群组行人重识别方法,包括:利用深度卷积神经网络骨干模型对群组图像进行初步特征提取;利用混合注意力机制模型对已初步提取的特征进行进一步提取;对已经过混合注意力模型的特征用最小二乘残差距离进行比对和评估。本发明通过充分考虑群组行人重识别问题中存在的各种挑战,利用了包括空间注意力和通道注意力的混合注意力模型,使网络更多地关注群组图像的关键区域和特征,提出基于最小二乘算法的新型最小二乘残差距离,更好地学习群组图像对之间的度量。本发明能够很好地适应由于群组行人图像带来的各种挑战,具有很好的多样性和普遍的适用性。 | ||
搜索关键词: | 群组 图像 注意力机制 注意力模型 最小二乘 注意力 卷积神经网络 最小二乘算法 关键区域 特征提取 比对 度量 挑战 多样性 评估 网络 学习 | ||
【主权项】:
1.一种基于混合注意力机制的群组行人重识别方法,其特征在于,包括:/nS1:基于深度卷积神经网络,形成群组行人重识别任务的骨干模型特征提取网络P,将整个群组行人重识别数据集上的图像对得到的骨干模型特征提取网络P进行应用,对群组行人的每一个图像s,均经过骨干模型特征提取网络P生成特征向量E;/nS2:在骨干模型特征提取网络P的基础上,加入混合注意力机制网络H,对已初步提取的特征进行进一步提取;其中,混合注意力机制网络H包括通道注意力模块C和空间注意力模块S,所述通道注意力模块C和空间注意力模块S分别作用于特征向量E不同维度上的特征;/nS3:通过混合注意力机制网络H捕获特征向量E的全局依赖,每一个输入的特征向量E分别经过混合注意力机制网络H中的通道注意力模块C和空间注意力模块S处理后得到注意力参数w
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910827179.0/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序