[发明专利]图像目标识别方法、装置、计算机设备及可读存储介质在审
| 申请号: | 202011616379.0 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112733652A | 公开(公告)日: | 2021-04-30 |
| 发明(设计)人: | 吴晓东 | 申请(专利权)人: | 深圳赛安特技术服务有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 目标 识别 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种图像目标识别方法,其特征在于,包括:
获取目标物体的图像;
对所述图像进行卷积运算得到反映所述图像内容的目标特征;
通过预生成的锚框在所述目标特征上生成候选框,识别覆盖所述目标物体的候选框并将其设为目标框;
根据所述目标框识别所述目标物体的类别。
2.根据权利要求1所述的图像目标识别方法,其特征在于,所述通过预生成的锚框在所述目标特征上生成候选框之前,所述方法还包括:
增强所述目标特征中的有效特征,抑制所述目标物体特征中的无效特征;
所述增强所述目标特征中的有效特征,抑制所述目标物体特征中的无效特征的步骤,包括:
获取目标特征,对所述目标特征进行分块形成区块特征;
通过注意力机制对所述区块特征,增强区块特征中的有效特征并抑制所述区块特征中的无效特征得到注意区块特征;
对所述拼接所述注意区块特征,获得增强有效特征且抑制无效特征的目标特征。
3.根据权利要求2所述的图像目标识别方法,其特征在于,所述通过注意力机制对所述区块特征,增强区块特征中的有效特征并抑制所述区块特征中的无效特征得到注意区块特征的步骤,包括:
对所述区块特征进行全局最大池化,以识别所述区块特征中的初级有效特征;
对所述初级有效特征中的有效特征进行全连接运算,获得所述初级有效特征中的注意力特征;
将所述区块特征与所述注意力特征相乘得到注意区块特征。
4.根据权利要求3所述的图像目标识别方法,其特征在于,所述全局最大池化是基于区块特征的全局上下文关系,由全局最大池化层的输入层获取所述区块特征中的特征值,提取所述输入层中最大的特征值,并将其保留在全局最大池化层的中间层,再提取所述中间层中最大的特征值并将其保留在所述全局最大池化层的输出层的过程。
5.根据权利要求1所述的图像目标识别方法,其特征在于,通过以下步骤生成所述锚框:
获取具有训练目标的训练图像,所述训练图像中标记有所述训练目标的训练尺寸;
将所述训练图像的训练尺寸制成坐标在预置的平面直角坐标系上形成簇点,汇总预置数量的所述簇点形成簇集合;
调用预置的聚类模型运算所述簇集合中的核心点,提取所述核心点的坐标并将所述坐标作为高度和宽度以获得锚框。
6.根据权利要求1所述的图像目标识别方法,其特征在于,所述识别覆盖所述目标物体的候选框并将其设为目标框的步骤,包括:
对所述初级卷积特征进行分类运算,以保留属于所述目标物体的候选框并删除不属于所述目标物体的候选框,得到分类矩阵;
对所述初级卷积特征进行回归运算,以调整所述初级卷积特征中候选框的中心点坐标及尺寸,得到坐标矩阵;
根据所述分类矩阵和所述坐标矩阵,筛选出被判定为覆盖所述目标物体的概率最高的候选框并将其设为前景框,删除与所述前景框的重叠程度超过预置重叠阈值的候选框;
将所述前景框在所述目标特征上执行切割操作,以在所述目标特征上形成目标框。
7.根据权利要求1所述的图像目标识别方法,其特征在于,所述根据所述目标框识别所述目标物体的类别之前,所述方法还包括:
调整所述目标特征中的目标框的尺寸和形状,使各所述目标框的尺寸和形状一致;
所述根据所述目标框识别所述目标物体的类别之后,所述方法还包括:
将所述目标物体的类别上传至区块链中。
8.一种图像目标识别装置,其特征在于,包括:
输入模块,用于获取目标物体的图像;
卷积模块,用于对所述图像进行卷积运算得到反映所述图像内容的目标特征;
定位模块,用于通过预生成的锚框在所述目标特征上生成候选框,识别覆盖所述目标物体的候选框并将其设为目标框;
识别模块,用于根据所述目标框识别所述目标物体的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳赛安特技术服务有限公司,未经深圳赛安特技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011616379.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





