[发明专利]一种文字方向混排的自动化OCR识别方法在审

专利信息
申请号: 202010421724.9 申请日: 2020-05-18
公开(公告)号: CN111797827A 公开(公告)日: 2020-10-20
发明(设计)人: 付艳 申请(专利权)人: 冠群信息技术(南京)有限公司
主分类号: G06K9/32 分类号: G06K9/32
代理公司: 重庆百润洪知识产权代理有限公司 50219 代理人: 孟仕杰
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文字 方向 自动化 ocr 识别 方法
【说明书】:

发明属于OCR识别技术领域,提供了一种文字方向混排的自动化OCR识别方法,包括:S101:识别原始文件各顶点坐标;S102:识别出文字区域以及文字区域初始坐标和对角坐标;S103:对识别出的文字区域进行色彩填充;S104:对旋转后的文件进行OCR识别,记录识别的文字,识别出旋转后的文字区域以及旋转后文字区域初始坐标和对角坐标;S105:判断旋转次数N是否达到最大值(360/A);S106:输出识别的文字,通过原始文件的各顶点坐标绘制原始文件文本区域矩形框,并还原文字在原始文件中的位置。本发明的一种文字方向混排的自动化OCR识别方法,具有大幅度减少由于OCR模型的限制导致的漏识。

技术领域

本发明涉及OCR识别技术领域,具体涉及一种文字方向混排的自动化OCR识别方法。

背景技术

近几年,随着大数据技术与人工智能技术的飞速发展,OCR识别技术也得到了长足进步。基于大数据样本与人工智能技术的基础上,OCR识别,特别是印刷体材料的OCR识别,正常的印刷体文字识别率已经非常接近于100%。

但是,在真正的工程应用领域或一些特定的场景下,对OCR的识别也提出了一些挑战。例如,手机拍摄或扫描仪扫描时,方向没控制好,造成图片整体旋转90度,在文字进行大幅度的倾斜情况下,例如,倾斜的角度有90度,180度或270度等就需要特殊的处理,否则,侧向卧倒或倒立的文字很难通过OCR正确识别。

目前常见的处理方法包括:增加各个方向的文字样本,另外,训练90度,180度和270度等不同的样本模型,识别的时候,用不同的模型来进行处理,这种方法带来的问题是:

1、前期需要构建大量的样本,成本比较高;

2、如果针对不同的文字方向训练得到不同的模型,在进行OCR识别的时候,就需要选择不同的模型进行识别文字,选择不同模型进行识别的过程将引起延时较大的问题;

3、如果把所有方向的文字都训练到一个模型中去,则会造成模型极为庞大,系统的OCR识别效率大幅度下降。

发明内容

针对现有技术中的缺陷,本发明提供的一种文字方向混排的自动化OCR识别方法,针对混排的原始文件而言,具有大幅度减少由于OCR模型的限制导致的漏识。

为了解决上述技术问题,本发明提供以下技术方案:

一种文字方向混排的自动化OCR识别方法,包括以下步骤:

S101:识别原始文件各顶点坐标,设定原始文件的旋转单位A,初始化原始文件的旋转次数N=0,旋转次数N={1,2,...,(360/A)};

S102:识别出文字区域以及文字区域初始坐标(X0,Y0)和对角坐标(X1,Y1),并记录识别的文字;

S103:对识别出的文字区域进行色彩填充,并对原始文件进行A角度旋转,旋转次数N加1,记录原始文件的累计旋转角度为A*N;

S104:对旋转后的文件进行OCR识别,记录识别的文字,识别出旋转后的文字区域以及旋转后文字区域初始坐标(M0N,N0N)和对角坐标(M1N,N1N);

S105:判断旋转次数N是否达到最大值(360/A),如果是,进行步骤S106;否则,重复进行步骤S103;

S106:输出识别的文字,通过原始文件的各顶点坐标绘制原始文件文本区域矩形框,并根据原始文件的不同旋转单位A*N、以及不同旋转单位A*N相对应的初始坐标(M0N,N0N)和对角坐标(M1N,N1N)还原文字在原始文件中的位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冠群信息技术(南京)有限公司,未经冠群信息技术(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010421724.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top