[发明专利]标识识别方法及其模型的训练方法、装置和电子系统在审
申请号: | 201910834664.0 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110543877A | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 张沁仪;邵帅 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 11463 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人: | 荣颖佳<国际申请>=<国际公布>=<进入 |
地址: | 100000 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 标识识别 加权处理 特征提取 预设 注意力机制 电子系统 基于位置 准确率 分辨 网络 引入 图片 | ||
1.一种标识识别方法,其特征在于,所述方法包括:
获取包含有标识的待识别图片;
通过预设的第一特征提取网络,提取所述待识别图片中,所述标识中字符的位置信息;
通过预设的第二特征提取网络,提取所述标识的特征图;
根据所述位置信息,对所述特征图中的特征值进行加权处理;
根据处理后的所述特征图,识别所述标识中的字符。
2.根据权利要求1所述的方法,其特征在于,所述第一特征提取网络包括卷积层和全连接层;
所述通过预设的第一特征提取网络,提取所述待识别图片中,所述标识中字符的位置信息的步骤,包括:
通过所述卷积层,提取所述待识别图片的特征数据;
将所述特征数据输入至所述全连接层,输出所述标识中字符的位置坐标。
3.根据权利要求1所述的方法,其特征在于,所述标识包括多行字符;
所述通过预设的第二特征提取网络,提取所述标识的特征图的步骤之前,所述方法还包括:将所述标识进行矫正处理,得到包含有单行字符的标识。
4.根据权利要求3所述的方法,其特征在于,将所述标识进行矫正处理的步骤,包括:
通过所述第一特征提取网络,提取所述待识别图片中,所述标识的顶点坐标,和所述标识中相邻两行字符之间的分界线端点坐标;
根据所述顶点坐标和所述分界线端点坐标,对所述标识进行矫正处理。
5.根据权利要求4所述的方法,其特征在于,根据所述顶点坐标和所述分界线端点坐标,对所述标识进行矫正处理的步骤,包括:
根据所述顶点坐标和所述分界线端点坐标,计算透视变换转换矩阵;
根据所述透视变换转换矩阵,对所述标识进行透视变换,得到变换后的标识;
根据所述变换后的标识中的分界线端点坐标,拆分所述变换后的标识中的每行字符;
将拆分后的每行字符顺序拼接成单行字符。
6.根据权利要求4所述的方法,其特征在于,根据所述顶点坐标和所述分界线端点坐标,对所述标识进行矫正处理的步骤之后,所述方法还包括:
根据所述顶点坐标和所述分界线端点坐标,对所述标识中字符的位置信息进行矫正处理。
7.根据权利要求6所述的方法,其特征在于,根据所述顶点坐标和所述分界线端点坐标,对所述标识中字符的位置信息进行矫正处理的步骤,包括:
根据所述顶点坐标和所述分界线端点坐标,计算透视变换转换矩阵;
根据所述透视变换转换矩阵,对所述标识中字符的位置信息进行透视变换,得到变换后的位置信息。
8.根据权利要求1所述的方法,其特征在于,所述标识中包括多个字符;
所述根据所述位置信息,对所述特征图中的特征值进行加权处理的步骤,包括:
针对每个字符,根据当前字符的位置信息,生成所述当前字符对应的正态分布图;其中,所述正态分布图中,所述当前字符的中心位置上的数值最大,距离所述中心位置越远的位置上的数值越小;
将所述特征图中的每个特征值,与所述正态分布图中,所述特征值相应位置上的数值相乘,得到所述当前字符对应的特征图。
9.根据权利要求8所述的方法,其特征在于,根据处理后的所述特征图,识别所述标识中的字符的步骤,包括:
针对每个字符,将当前字符对应的特征图输入至预设的全连接网络中,输出概率分布序列;其中,所述概率分布序列中包括多个概率值,每个所述概率值用于指示:所述当前字符为预设字符的概率;
将所述概率分布序列中,最大的概率值对应的预设字符确定为当前字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910834664.0/1.html,转载请声明来源钻瓜专利网。