[发明专利]一种使用预处理提高图文识别正确率的方法在审
申请号: | 201811598503.8 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109753972A | 公开(公告)日: | 2019-05-14 |
发明(设计)人: | 傅涛;王力;郑轶;许骏杰 | 申请(专利权)人: | 江苏博智软件科技股份有限公司 |
主分类号: | G06K9/36 | 分类号: | G06K9/36 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210012 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 正确率 预处理 干扰因素 图文识别 敏感词检测 海量图片 减少干扰 全文检索 社交网络 信息载体 互联网 识别率 中文字 图片 | ||
互联网以及社交网络的发展带来了海量图片信息,伴随着图片成为互联网中的主要信息载体,难题随之出现。在旋转、倾斜等干扰因素下,直接对图片中文字做OCR识别,正确率极低,低识别率严重影响后续敏感词检测、全文检索的准确性。本发明名称为一种使用预处理提高图文识别正确率的方法,对存在干扰因素的图片进行预处理,减少干扰因素后再做OCR图文识别,可显著提高识别正确率。
技术领域
本发明涉及涉及图像处理、OCR图文识别领域。
背景技术
互联网以及社交网络的发展带来了海量图片信息,伴随着图片成为互联网中的主要信息载体,难题随之出现。在旋转、倾斜等干扰因素下,直接对图片中文字做OCR识别,正确率极低,低识别率严重影响后续敏感词检测、全文检索的准确性。现状对存在干扰因素的图片进行预处理,减少干扰因素后再做OCR图文识别,可显著提高识别正确率。
发明内容
鉴于现有技术的缺陷,本发明创造提出一种使用预处理提高图文识别正确率的方法,在旋转、倾斜等干扰因素下,图片中文字的识别正确率极低,要解决此技术问题,提高图文识别正确率,提出了预处理方法来解决。
采用的解决方案如下:
一种使用预处理提高图文识别正确率的方法,其工作步骤如下:
步骤1:计算图像旋转角度。通过卡尼边缘检测和概率霍夫线变换计算出图像旋转角度。
步骤2:校正旋转图像。通过二值化和仿射变换校正旋转。
步骤3:校正透视图像。校正旋转后的图像通过卡尼边缘检测、概率霍夫线变换和透视变换校正透视。
有益效果:
与现有技术相比,本发明创造的优点在于:采取解决方案后,OCR识别正确率有百分之四十左右的提升,显著提高了后续内容检测和检索的准确率。
附图说明:
图1为本发明创造的流程示意图。
具体实施方式:
下面结合附图1,对本发明创造做进一步阐述:
一种针对国产操作系统的图片内容提取方法,其实施例如下:
对原始图像进行卡尼边缘检测,生成黑底边缘区域图像,再进行概率霍夫线变换得到图像中存在的边框,去除边框。对去除边框后的图像做概率霍夫线变换可检测出直线,计算所有直线旋转角度的平均值可获得图像的旋转角度。
待校正的图像做二值化处理后计算最小区域矩形,根据最小区域矩形的中心点和计算出的旋转角度对原始图像做仿射变换,生成校正旋转后的图像。
校正旋转后的图像通过卡尼边缘检测、概率霍夫线变换去除图像中的边框之后,计算图像中的最小区域矩形和矩形边界框,根据矩形四个点的坐标对图像做透视变换,生成校正透视后的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏博智软件科技股份有限公司,未经江苏博智软件科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811598503.8/2.html,转载请声明来源钻瓜专利网。