[发明专利]一种文字方向混排的自动化OCR识别方法在审

专利信息
申请号: 202010421724.9 申请日: 2020-05-18
公开(公告)号: CN111797827A 公开(公告)日: 2020-10-20
发明(设计)人: 付艳 申请(专利权)人: 冠群信息技术(南京)有限公司
主分类号: G06K9/32 分类号: G06K9/32
代理公司: 重庆百润洪知识产权代理有限公司 50219 代理人: 孟仕杰
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文字 方向 自动化 ocr 识别 方法
【权利要求书】:

1.一种文字方向混排的自动化OCR识别方法,其特征在于,包括以下步骤:

S101:识别原始文件各顶点坐标,设定原始文件的旋转单位A,初始化原始文件的旋转次数N=0,旋转次数N={1,2,...,(360/A)};

S102:识别出文字区域以及文字区域初始坐标(X0,Y0)和对角坐标(X1,Y1),并记录识别的文字;

S103:对识别出的文字区域进行色彩填充,并对原始文件进行A角度旋转,旋转次数N加1,记录原始文件的累计旋转角度为A*N;

S104:对旋转后的文件进行OCR识别,记录识别的文字,识别出旋转后的文字区域以及旋转后文字区域初始坐标(M0N,N0N)和对角坐标(M1N,N1N);

S105:判断旋转次数N是否达到最大值(360/A),如果是,进行步骤S106;否则,重复进行步骤S103;

S106:输出识别的文字,通过原始文件的各顶点坐标绘制原始文件文本区域矩形框,并根据原始文件的不同旋转单位A*N、以及不同旋转单位A*N相对应的初始坐标(M0N,N0N)和对角坐标(M1N,N1N)还原文字在原始文件中的位置。

2.根据权利要求1所述的一种文字方向混排的自动化OCR识别方法,其特征在于,所述步骤S106中根据原始文件的不同旋转单位A*N、以及不同旋转单位A*N相对应的初始坐标(M0N,N0N)和对角坐标(M1N,N1N)还原文字在原始文件中位置,包括以下步骤:

S10601:根据原始文件的不同旋转单位A*N建立旋转后初始坐标(M0N,N0N)与初始坐标(X0,Y0)之间的函数关系S1和S2,其中(M0N,N0N)=S1(X0)和(M0N,N0N)=S2(Y0),以及旋转后对角坐标(M1N,N1N)与对角坐标(X1,Y1)之间的函数关系S3和S4,其中(M1N,N1N)=S3(X1)和(M1N,N1N)=S4(Y1);

S10602:将函数关系S1和S2进行逆变换得到X0和Y0,其中,X0=S1-1(M0N,N0N)和Y0=S2-1(M0N,N0N);将函数关系S3和S4进行逆变换得到X1和Y1,其中,X1=S3-1(M1N,N1N)和Y1=S4-1(M1N,N1N)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冠群信息技术(南京)有限公司,未经冠群信息技术(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010421724.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top