[发明专利]标识识别方法及其模型的训练方法、装置及电子系统有效
申请号: | 201910836667.8 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110533119B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 张沁仪;邵帅 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
地址: | 100000 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标识 识别 方法 及其 模型 训练 装置 电子 系统 | ||
1.一种标识识别方法,其特征在于,包括:
获取包含有标识的待识别图片;
通过预设的特征提取网络,提取所述待识别图片的多层级初始特征图;
对所述多层级初始特征图中的指定层级的初始特征图进行特征融合处理,得到融合特征图;
提取所述融合特征图的全局特征;
根据所述融合特征图和所述全局特征,识别所述待识别图片中的标识。
2.根据权利要求1所述的方法,其特征在于,所述特征提取网络包括多层卷积层;
所述通过预设的特征提取网络,提取所述待识别图片的多层级初始特征图的步骤,包括:将所述待识别图片输入至所述多层卷积层中,通过每层所述卷积层提取所述待识别图片的相应层级的初始特征图,得到所述待识别图片的多层级初始特征图。
3.根据权利要求2所述的方法,其特征在于,所述指定层级的初始特征图包括:所述多层卷积层中,从最后一级的卷积层开始的连续指定数量的卷积层输出的初始特征图;所述最后一级的卷积层用于:输出所述待识别图片的最高层级的初始特征图。
4.根据权利要求1或3所述的方法,其特征在于,对所述多层级初始特征图中的指定层级的初始特征图进行特征融合处理,得到融合特征图的步骤,包括:
对所述多层级初始特征图中的指定层级的初始特征图,进行级联融合处理,得到中间结果;
对所述中间结果进行卷积计算,得到融合特征图。
5.根据权利要求1所述的方法,其特征在于,所述全局特征包括所述融合特征图中,每个通道下的子特征图的平均值。
6.根据权利要求5所述的方法,其特征在于,所述提取所述融合特征图的全局特征的步骤,包括:采用预设的平均池化层提取所述融合特征图中,每个通道下的子特征图的平均值。
7.根据权利要求5所述的方法,其特征在于,根据所述融合特征图和所述全局特征,识别所述待识别图片中的标识的步骤包括:
针对每个通道,生成当前通道的虚拟特征图;其中,所述虚拟特征图中每个像素点的特征值为:所述融合特征图中,所述当前通道下的子特征图的平均值;所述虚拟特征图的尺度与所述当前通道下的子特征图的尺度相同;
将所述融合特征图中,当前通道的子特征图与所述当前通道的虚拟特征图中,相应位置上的特征值相加,得到所述当前通道的最终特征图;
根据每个通道的最终特征图,识别所述待识别图片中的标识。
8.根据权利要求7所述的方法,其特征在于,根据每个通道的最终特征图,识别所述待识别图片中的标识的步骤,包括:
将所述每个通道的最终特征图输入至预设的全连接层,得到输出结果;
针对每个字符,将所述输出结果中,与当前字符相关联的数值输入至预设的softmax函数中,输出所述当前字符对应的概率向量;其中,所述概率向量包括:所述当前字符为指定字符的概率;
将所述概率向量中,最大概率对应的指定字符确定为所述当前字符。
9.一种标识识别模型的训练方法,其特征在于,包括:
基于预设的训练集合确定当前训练图片;其中,所述当前训练图片上标注有标准标识字符;
将所述当前训练图片输入至预设的特征提取网络,输出所述当前训练图片的多层级初始特征图;
对所述多层级初始特征图中的指定层级的初始特征图进行特征融合处理,得到融合特征图;
提取所述融合特征图的全局特征,根据所述融合特征图和所述全局特征,识别所述当前训练图片中的标识,得到识别结果;
根据所述标准标识字符和预设的损失函数,计算所述识别结果的损失值;
继续执行基于预设的训练集合确定当前训练图片的步骤,直至所述损失值收敛,得到标识识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910836667.8/1.html,转载请声明来源钻瓜专利网。