[发明专利]一种文本图像的倾斜角矫正方法及终端有效

专利信息
申请号: 201910189109.7 申请日: 2019-03-13
公开(公告)号: CN109919155B 公开(公告)日: 2021-03-12
发明(设计)人: 庄国金;陈文传;杜保发;林玉玲;郝占龙;方恒凯;吴建杭 申请(专利权)人: 厦门商集网络科技有限责任公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34;G06K9/36
代理公司: 福州科扬专利事务所 35001 代理人: 何小星
地址: 361101 福建省厦*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 图像 倾斜角 矫正 方法 终端
【说明书】:

本发明涉及一种文本图像的倾斜角矫正方法及终端,属于数据处理领域。本发明通过矫正第一文本图像的倾斜角,得到经处理的第二文本图像;所述倾斜角的取值范围为0度至45度;调用OCR识别引擎识别所述第二文本图像,得到第一字符串;将所述第二文本图像旋转180度,得到经处理的第三文本图像;调用OCR识别引擎识别所述第三文本图像,得到第二字符串;若所述第一字符串中的高频词汇个数大于所述第二字符串中的高频词汇个数,则标记所述第二文本图像为最终文本图像;否则,标记所述第三文本图像为最终文本图像。实现提高矫正文本图像倾斜角的准确度。

技术领域

本发明涉及一种文本图像的倾斜角矫正方法及终端,属于数据处理领域。

背景技术

人们在日常工作、生活中常需要将纸质文档转换为电子文档。常见的电子文档转换方法为,先拍摄纸质文档,再将纸质文档的照片上传至电子设备中。但是,在拍摄过程中常出现照片倾斜等情况,影响人们通过电子设备阅读电子文档的体验。

现有技术中,申请号为201510047692.X的中国专利文献提供一种文本图像的倾斜角矫正、版面分析方法和助视装置、系统。该文本图像的倾斜角矫正方法包括:对文本图像进行边缘检测,得到边缘图像;对文本图像进行连通域检测,得到文本图像的连通域的外接矩形的中心点;对边缘图像进行连通域检测,得到边缘图像的连通域的外接矩形的中心点;对所得到的文本图像的连通域的外接矩形的中心点和边缘图像的连通域的外接矩形的中心点的集合应用霍夫变换法进行倾检测,得到文本图像的倾斜角;以及在倾斜角大于或等于预设的第一倾斜角阈值的情况下,对文本图像进行倾斜角矫正。本发明的文本图像的倾斜角矫正方法,不需要对文本图像的每一个像素点作霍夫变换,运算量小,受光照影响小,准确度高。

但是,上述专利文献提供的文本图像的倾斜角矫正方法,所能调整的倾斜角度范围为0-45度,具有一定的局限性,对于倾斜角度大的文本图像的倾斜角矫正准确度不高。

发明内容

本发明所要解决的技术问题是:如何提高矫正倾斜角度大的文本图像的准确度。

为了解决上述技术问题,本发明采用的技术方案为:

本发明提供一种文本图像的倾斜角矫正方法,包括:

矫正第一文本图像的倾斜角,得到经处理的第二文本图像;所述倾斜角的取值范围为0度至45度;

调用OCR识别引擎识别所述第二文本图像,得到第一字符串;

将所述第二文本图像旋转180度,得到经处理的第三文本图像;

调用OCR识别引擎识别所述第三文本图像,得到第二字符串;

若所述第一字符串中的高频词汇个数大于所述第二字符串中的高频词汇个数,则标记所述第二文本图像为最终文本图像;否则,标记所述第三文本图像为最终文本图像。

优选地,矫正第一文本图像的倾斜角,得到经处理的第二文本图像,具体为:

将所述第一文本图像旋转90度,得到经处理的第四文本图像;

对所述第一文本图像进行连通域检测,得到第一中心点集合;所述第一中心点集合由所述第一文本图像中的连通域的中心点组成;对所述第四文本图像进行连通域检测,得到第二中心点集合;所述第二中心点集合由所述第四文本图像中的连通域的中心点组成;

根据所述第一中心点集合拟合直线,得到第一直线集合;根据所述第二中心点集合拟合直线,得到第二直线集合;所述直线与水平方向的夹角小于45度;

若所述第一直线集合的元素个数大于所述第二直线集合的元素个数,则根据所述第一直线集合矫正所述第一文本图像的倾斜角,得到第二文本图像;否则:

根据所述第二直线集合矫正所述第四文本图像的倾斜角,得到第二文本图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门商集网络科技有限责任公司,未经厦门商集网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910189109.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top