[发明专利]标识识别方法及其模型的训练方法、装置和电子系统在审
申请号: | 201910834664.0 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110543877A | 公开(公告)日: | 2019-12-06 |
发明(设计)人: | 张沁仪;邵帅 | 申请(专利权)人: | 北京迈格威科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 11463 北京超凡宏宇专利代理事务所(特殊普通合伙) | 代理人: | 荣颖佳<国际申请>=<国际公布>=<进入 |
地址: | 100000 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 标识识别 加权处理 特征提取 预设 注意力机制 电子系统 基于位置 准确率 分辨 网络 引入 图片 | ||
本发明提供了一种标识识别方法及其模型的训练方法、装置和电子系统,其中,该标识识别方法包括:通过预设的第一特征提取网络,提取待识别图片中所包含的标识中字符的位置信息;通过预设的第二特征提取网络,提取该标识的特征图;根据该位置信息,对该特征图中的特征值进行加权处理,进而识别该标识中的字符。该方法通过标识中字符的位置信息,对标识的特征图进行加权处理,从而在特征图上引入基于位置信息的注意力机制,以有效分辨每个字符所在位置,从而提高了标识识别的准确率。
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种标识识别方法及其模型的训练方法、装置和电子系统。
背景技术
随着我国交通运输的不断发展,智能交通系统的推广变的越来越重要,而作为智能交通系统的一个重要组成部分,车辆牌照识别系统对于交通管理、治安处罚等工作的智能化起着十分重要的作用。它可广泛应用于交通流量检测,交通控制与诱导,机场、港口、小区的车辆管理,不停车自动收费,闯红灯等违章车辆监控以及车辆安全防盗等领域,具有广阔的应用前景。
相关技术中,在对车牌等包含多个字符的标识进行识别时,大多基于一个特征图识别标识中的多个字符,难以有效分辨每个字符所在位置,进而影响了标识识别的准确率。
发明内容
本发明的目的在于提供一种标识识别方法及其模型的训练方法、装置和电子系统,以提高标识识别的准确率。
第一方面,本发明提供的一种标识识别方法,所述方法包括:获取包含有标识的待识别图片;通过预设的第一特征提取网络,提取所述待识别图片中,所述标识中字符的位置信息;通过预设的第二特征提取网络,提取所述标识的特征图;根据所述位置信息,对所述特征图中的特征值进行加权处理;根据处理后的所述特征图,识别所述标识中的字符。
进一步的,所述第一特征提取网络包括卷积层和全连接层;所述通过预设的第一特征提取网络,提取所述待识别图片中,所述标识中字符的位置信息的步骤,包括:通过所述卷积层,提取所述待识别图片的特征数据;将所述特征数据输入至所述全连接层,输出所述标识中字符的位置坐标。
进一步的,所述标识包括多行字符;所述通过预设的第二特征提取网络,提取所述标识的特征图的步骤之前,所述方法还包括:将所述标识进行矫正处理,得到包含有单行字符的标识。
进一步的,将所述标识进行矫正处理的步骤,包括:通过第一特征提取网络,提取所述待识别图片中,所述标识的顶点坐标,和所述标识中相邻两行字符之间的分界线端点坐标;根据所述顶点坐标和所述分界线端点坐标,对所述标识进行矫正处理。
进一步的,根据所述顶点坐标和所述分界线端点坐标,对所述标识进行矫正处理的步骤,包括:根据所述顶点坐标和所述分界线端点坐标,计算透视变换转换矩阵;根据所述透视变换转换矩阵,对所述标识进行透视变换,得到变换后的标识;根据所述变换后的标识中的分界线端点坐标,拆分所述变换后的标识中的每行字符;将拆分后的每行字符顺序拼接成单行字符。
进一步的,根据所述顶点坐标和所述分界线端点坐标,对所述标识进行矫正处理的步骤之后,所述方法还包括:根据所述顶点坐标和所述分界线端点坐标,对所述标识中字符的位置信息进行矫正处理。
进一步的,根据所述顶点坐标和所述分界线端点坐标,对所述标识中字符的位置信息进行矫正处理的步骤,包括:根据所述顶点坐标和所述分界线端点坐标,计算透视变换转换矩阵;根据所述透视变换转换矩阵,对所述标识中字符的位置信息进行透视变换,得到变换后的位置信息。
进一步的,所述标识中包括多个字符;所述根据所述位置信息,对所述特征图中的特征值进行加权处理的步骤,包括:针对每个字符,根据当前字符的位置信息,生成所述当前字符对应的正态分布图;其中,所述正态分布图中,所述当前字符的中心位置上的数值最大,距离所述中心位置越远的位置上的数值越小;将所述特征图中的每个特征值,与所述正态分布图中,所述特征值相应位置上的数值相乘,得到所述当前字符对应的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910834664.0/2.html,转载请声明来源钻瓜专利网。