[发明专利]基于密集连接网络的多线程营业执照定位识别方法在审
| 申请号: | 201811468489.X | 申请日: | 2018-12-03 |
| 公开(公告)号: | CN109815946A | 公开(公告)日: | 2019-05-28 |
| 发明(设计)人: | 李春国;杨哲;张旭帆;曹钊铭;徐琴珍;杨绿溪 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/68 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
| 地址: | 211189 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 许可证号 连接网络 多线程 纠错 预处理 图像预处理 结果对比 模块输出 网络识别 文字识别 准确度 图像 场景 融合 网络 | ||
1.基于密集连接网络的多线程营业执照定位识别方法,其特征在于,包括如下步骤:
步骤1,对输入的营业执照图像进行预处理;
步骤2,基于步骤1的图像预处理结果,对处理后的结果分别进行营业执照识别处理和许可证号识别处理,营业执照识别处理采用基于密集连接网络的多线程识别网络识别出营业执照上的所有文字,许可证号识别处理识别出营业执照上的许可证号;
步骤3,将营业执照识别模块和许可证号识别模块输出的识别结果相对应地融合,利用许可证号识别处理的识别结果,为营业执照识别处理识别出的许可证号纠错。
2.根据权利要求1所述的基于密集连接网络的多线程营业执照定位识别方法,其特征在于,所述步骤1具体包括如下子步骤:
步骤1.1:对输入图像进行规范化处理,通过平移、缩放等几何仿射变换将图像调整到同一尺寸,其中,仿射变换的表达式为:
其中,(u,v)表示输入图像中像素的坐标,T为变换矩阵,可将输入像素点映射到输出图像中的不同位置,(x,y)表示原始像素点(u,v)经过变换矩阵T处理后的在输出图像中的像素坐标;将上式展开可得:
x=t11u+t21v+t31
y=t12u+t22v+t32
平移变换是给图像中的所有点的坐标都加上Δu和Δv,其变化表达式为:
其中,Δu和Δv分别为预先设定的相对原输入图像的像素点的横、纵坐标的偏移量;
缩放变换即将图像按照给定的比例r放大或缩小,当r>1时图像被放大,当0<r<1时图像被缩小,其变换表达式为:
步骤1.2:对图像进行平滑处理,消除图像中无关信息,滤除干扰噪声。
3.根据权利要求2所述的基于密集连接网络的多线程营业执照定位识别方法,其特征在于,所述步骤1.2中采用中值滤波法对图像进行平滑处理。
4.根据权利要求1所述的基于密集连接网络的多线程营业执照定位识别方法,其特征在于,所述步骤2中营业执照识别处理包括如下子步骤:
步骤2.1:文字定位,在预处理后的营业执照图片中框选出待识别的文字预测候选区域;
步骤2.2:文字识别,对步骤2.1中输出的文本候选框进行处理,基于密集连接网络的多线程识别网络包括三个线程,其一包括三个密集组,密集组之间设置有过渡组,密集组包括由若干卷积单元组成的卷积组,卷积核大小为5*5;其二包括卷积核大小为3*3的可分离卷积组;其三包括卷积核大小为1*1的可分离卷积组。
5.根据权利要求4所述的基于密集连接网络的多线程营业执照定位识别方法,其特征在于,所述步骤2.1中采用连接文本提议网络提取文本候选框,通过滑动窗遍历VGG16提取出的特征图,提取出得分较高的文本候选框作为文字识别网络的输入。
6.根据权利要求1所述的基于密集连接网络的多线程营业执照定位识别方法,其特征在于,所述步骤2中许可证号识别处理包括如下子步骤:
步骤2.3:判定横、纵版面,通过比较输入图像的高度、宽度,对其版面进行判断,并且根据版面的不同选取特定的参数,检测许可证号的位置;
步骤2.4:许可证号定位裁剪,框选出许可证号的候选区域;
步骤2.5:对许可证号的切割进行判决,如果成功截取许可证号,则送入识别网络;反之,输出不成功信息;
步骤2.6:采用卷积循环网络对许可证号进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811468489.X/1.html,转载请声明来源钻瓜专利网。





