[发明专利]图结构表征的高阶关联发现细粒度图像识别方法及装置有效
| 申请号: | 202110567940.9 | 申请日: | 2021-05-24 |
| 公开(公告)号: | CN113222041B | 公开(公告)日: | 2022-06-07 |
| 发明(设计)人: | 李甲;赵一凡;石鼎丰;赵沁平 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 吴梅锡;刘芳 |
| 地址: | 100191 北京市海淀区学*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 结构 表征 关联 发现 细粒度 图像 识别 方法 装置 | ||
本发明实施例提供一种图结构表征的高阶关联发现细粒度图像识别方法及装置,其中方法包括:将待分类图像输入具有多个阶段的卷积神经网络特征提取器,提取最后一个阶段的两层网络特征图,根据网络特征图,构建混合高阶注意力模块,并根据混合高阶注意力模块形成高阶特征向量池,将向量池中的每一个向量作为节点,并利用高阶特征间的语义相似性,分组形成代表性向量节点,对代表性向量节点进行全局池化,得到分类向量,并基于分类向量,通过全连接层和分类器得到细粒度分类结果,无需依赖额外的部件特征提取网络,实现对图像特征的快速准确提取,利用图像自身信息构建图像特征间的关联关系,得到细粒度特征的精细表征,提高图像的识别效果。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图结构表征的高阶关联发现细粒度图像识别方法及装置。
背景技术
图像细粒度识别是根据大量细粒度分类类别和算法识别将输入的图像进行归纳分类的一种技术。该技术可广泛应用于互联网分析、人脸验证、行人识别以及智慧城市等各个领域中。
目前,大多数的图像细粒度识别都是倾向于利用区域特征,或部件级表征,来增强图像的识别效果。但这类方法需要依赖额外的部件特征提取网络,而部件提取到的特征容易存在不稳定表征,影响图像识别效果。
发明内容
本发明实施例提供一种图结构表征的高阶关联发现细粒度图像识别方法及装置,无需依赖额外的部件特征提取网络,通过单阶段的网络表征,实现对图像特征的快速准确提取,提高图像识别效果。
第一方面,本发明实施例提供一种图结构表征的高阶关联发现细粒度图像识别方法,所述方法包括:
将待分类图像输入具有多个阶段的卷积神经网络特征提取器,提取最后一个阶段的两层网络特征图Xi与Yi;
根据所述网络特征图Xi与Yi,构建空间门控网络增强的混合高阶注意力模块,并根据所述混合高阶注意力模块形成高阶特征向量池;
将所述高阶特征向量池中的每一个向量作为节点,构建图神经网络,并利用高阶特征间的语义相似性,分组形成代表性向量节点;
对所述代表性向量节点进行全局池化,得到分类向量,并基于所述分类向量,通过全连接层和分类器得到细粒度分类结果。
可选的,根据所述网络特征图Xi与Yi,构建空间门控网络增强的混合高阶注意力模块,并根据所述混合高阶注意力模块形成高阶特征向量池,包括:
根据所述网络特征图Xi与Yi,构建所述混合高阶注意力模块对应的注意力感知矩阵Pi;
将根据所述注意力感知矩阵Pi和所述网络特征图Xi得到的空间感知高阶矩阵门控网络和所述网络特征图Xi进行融合,得到位置关联矩阵Ei;
将所述位置关联矩阵Ei转置后与编码后的网络特征图Yi融合,形成所述高阶特征向量池。
可选的,根据所述网络特征图Xi与Yi,构建所述混合高阶注意力模块对应的注意力感知矩阵Pi,包括:
对网络特征图Yi进行编码;
根据所述网络特征图Xi的转置和编码后的网络特征图Yi,确定所述混合高阶注意力模块中各位置的注意力感知矩阵Pi:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110567940.9/2.html,转载请声明来源钻瓜专利网。





