[发明专利]基于Transformer的车牌识别方法、系统、计算机设备及其存储介质在审
| 申请号: | 202210043065.9 | 申请日: | 2022-01-14 |
| 公开(公告)号: | CN114399758A | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 张俊;刘瑞哲 | 申请(专利权)人: | 深圳市万物云科技有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 冯玉洁 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 transformer 车牌 识别 方法 系统 计算机 设备 及其 存储 介质 | ||
本发明公开了基于Transformer的车牌识别方法、系统、计算机设备及其存储介质,该方法包括:利用预设的数据集构造策略对初始图像进行图像预处理,得到目标图像;将目标图像进行填充,得到指定大小的正方形图像,并将正方形图像进行切割,得到多个图像小块;将每个图像小块的三维向量输入至全连接层进行线性透射转换成二维向量,并与对应的位置编码进行拼接,将拼接后的图像小块的二维向量进行组合,得到目标向量;将目标向量输入目标神经网络内进行识别,得到目标车牌的位置信息和文字信息。本发明在将进行图像处理后的目标图像直接输入至目标神经网络中进行识别,获取车牌的位置信息和文字信息,实现了端到端的车牌识别,提高了识别效率。
技术领域
本发明涉及车牌识别技术领域,尤其涉及基于Transformer的车牌识别方法、系统、计算机设备及其存储介质。
背景技术
车牌识别技术是计算机视频图像识别技术在车辆牌照识别中的一种应用,车牌识别技术要求能够将运动中的汽车牌照从复杂背景中提取并识别出来,通过车牌提取、图像预处理、特征提取、车牌字符识别等技术,识别车辆牌号、颜色等信息。传统的车牌识别方法需要先对车辆进行检测,然后再对车牌进行定位,并对车牌上的文字进行分割,最后输出车牌信息。传统的车牌识别方法过多的处理步骤导致了整体计算量需要较大,过程较为复杂,容易出现数据错误的情况。并且,在面对复杂气象场景和低质量光学环境时,识别效果显著下降,并且面对不同地域的车牌,准确性也存在较大差异,应用范围相对较小。
发明内容
本发明实施例提供了基于Transformer的车牌识别方法、系统、计算机设备及其存储介质,旨在解决现有技术中车牌识别处理过程较多,面对复杂环境车牌识别效果差,并且应用范围小的问题。
第一方面,本发明实施例提供了一种基于Transformer的车牌识别方法,包括:
利用预设的数据集构造策略对初始图像进行图像预处理,得到目标图像;
将所述目标图像进行填充,得到指定大小的正方形图像,并将所述正方形图像进行切割,得到多个图像小块;
将每个图像小块的三维向量输入至全连接层进行线性透射转换成二维向量,并与对应的位置编码进行拼接,将拼接后的图像小块的二维向量进行组合,得到目标向量;
将所述目标向量输入目标神经网络内进行识别,得到目标车牌的位置信息和文字信息。
第二方面,本发明实施例提供了一种基于Transformer的车牌识别系统,其包括:
图像预处理单元,用于利用预设的数据集构造策略对初始图像进行图像预处理,得到目标图像;将所述目标图像进行填充,得到指定大小的正方形图像,并将所述正方形图像进行切割,得到多个图像小块;将每个图像小块的三维向量输入至全连接层进行线性透射转换成二维向量,并与对应的位置编码进行拼接,将拼接后的图像小块的二维向量进行组合,得到目标向量;
车牌信息识别单元,用于将所述目标向量输入目标神经网络内进行识别,得到目标车牌的位置信息和文字信息。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于Transformer的车牌识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于Transformer的车牌识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市万物云科技有限公司,未经深圳市万物云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210043065.9/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





