[发明专利]图像识别方法及装置、残差网络模型的构建方法在审
申请号: | 202011055407.6 | 申请日: | 2020-09-29 |
公开(公告)号: | CN114332522A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 孙鹏飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 网络 模型 构建 | ||
1.一种图像识别方法,其中,包括:
获取待识别图像的特征信息;
将所述特征信息输入至残差网络模型进行分析,得到分析结果,其中,所述残差网络模型中的每个残差块中包括多个分支,其中,所述多个分支中的指定分支中至少包括选择性卷积核;
依据所述分析结果确定所述待识别图像的图像类型。
2.根据权利要求1所述的方法,其中,所述指定分支的数量为多个,且多个所述指定分支中的选择性卷积核是相同的。
3.根据权利要求2所述的方法,其中,将所述特征信息输入至残差网络模型进行分析,得到分析结果,包括:
采用所述多个分支对所述特征信息进行分析,得到子分析结果;并基于所述多个子分析结果确定所述分析结果。
4.根据权利要求3所述的方法,其中,基于所述多个子分析结果确定所述分析结果,包括:
确定所述多个分支中多个所述指定分支的第一类子分析结果,其中,该第一类子分析结果是基于多个所述指定分支的分析结果和多个指定分支所对应的权重确定的;
确定所述多个分支中除多个所述指定分支之外的分支的第二类子分析结果;
基于所述第一类子分析结果和第二类子分析结果确定所述分析结果。
5.根据权利要求4所述的方法,其中,多个指定分支所对应的权重是相同的。
6.根据权利要求2所述的方法,其中,所述残差网络模型是通过以下方式训练得到的:
对多个所述指定分支训练的过程中,对于每个指定分支的输出结果分别乘以一个系数,其中一个指定分支的系数为a,其余指定分支的系数为1-a,且在每次训练是a从0和1随机进行取值。
7.根据权利要求1所述的方法,其中,所述指定分支中还包括:用于实现平移不变性功能的模糊池化模块,该模糊池化模块用于对输入的数据进行池化处理。
8.根据权利要求7所述的方法,其中,所述指定分支中还包括:第一卷积核、第二卷积核;其中,所述第一卷积核的输出端与所述选择性卷积核的输入端连接;所述选择性卷积核的输出端与所述第二卷积核的输入端连接;所述第二卷积核的输出端与所述模糊池化模块的输入端连接,用于对输入第二卷积核的数据进行升维处理。
9.根据权利要求7所述的方法,其中,所述模糊池化模块包括3*3的抗锯齿核。
10.根据权利要求1至9中任意一项所述的方法,其中,所述方法还包括:在对所述残差网络模型进行训练的过程中,采用目标损失函数对所述残差网络模型进行优化,其中,所述目标损失函数为基于以下类型的损失函数共同确定的:基于正类的损失函数,基于类内相似性的损失函数和树状损失函数。
11.根据权利要求10所述的方法,其中,所述目标损失函数通过以下方式确定:
L=αLPCL+βLCL+γLTSL
其中,L表示目标损失函数,LPCL表示基于正类的损失函数,LCL表示基于类内相似性的损失函数,LTSL表示树状损失函数,α、β和γ是常数。
12.根据权利要求11所述的方法,其中,β小于α和γ。
13.一种残差网络模型的构建方法,其中,包括:
对于残差网络模型中的残差块,将所述残差块中第一分支中的指定卷积核替换为选择性卷积核,其中,所述第一分支为除所述残差网络模型中的跳接分支之外的分支,所述跳接分支为所述残差块的输入端和输出端直接连通的分支;
在所述残差块中设置与具有所述选择性卷积核的第一分支相同的第二分支,得到目标残差块;
基于所述目标残差块确定构建所述残差网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011055407.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序