[发明专利]用于文字识别的文本图像预处理方法无效

专利信息
申请号: 200810058451.5 申请日: 2008-05-27
公开(公告)号: CN101315664A 公开(公告)日: 2008-12-03
发明(设计)人: 邵玉斌 申请(专利权)人: 昆明理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46
代理公司: 昆明正原专利代理有限责任公司 代理人: 金耀生
地址: 650093云南*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 文字 识别 文本 图像 预处理 方法
【说明书】:

技术领域

发明涉及图像处理技术领域,具体地说是用于文字识别的文本图像预处理方法。

背景技术

在文字识别、计算机视觉和机器理解等领域的应用中,对复杂环境图像中的文字内容 进行分离和识别是技术难点之一。机器理解文字是基于文字识别结果的,而用于文字识别 的源图像的质量越好,识别率就越高。文本图像预处理方法的目的是为文字识别算法提供 一种几何失真小、前景文本分离完善的二值化图像。用于文字识别的图像预处理方法一般 是对图像中的文字内容区域进行识别,然后采用图像平移、旋转和伸缩等方法对文字内容 区域进行校正,然后对校正结果进行全局固定域值的二值化处理。

目前,针对文本内容的图像几何校正方法主要集中于对文本图像的倾斜校正上,根据 文字走向和行间空白将文本校正为水平或垂直方向的。然而,这种倾斜校正方法仅对于倾 斜的矩形区域文本有效。对于实际摄像得到的图像,由于透视关系和镜头非线性失真,原 为矩形的文字区域将发生失真变为不规则四边形或曲四边形。目前没有较为便捷的针对文 字图片失真为不规则四边形或曲四边形的几何校正方法。针对亮度背景变化的文本图像的 二值化问题,采用全局固定域值方法不足之处是不能取得好的效果,而采用分块图像局部 二值化域值方法会导致分块边界效应。在文字识别预处理领域,目前尚无一种实用软件能 够对照相机摄影的文字图片进行有效的几何校正和文字前景的提取。

发明内容

本发明的目的在于为文字识别和机器理解提供一种方便实用的用于文字识别的文本 图像预处理方法文字图片预处理方法,利用此方法,可根据照相机拍摄的文字图片,进行 文字区域的识别、并将识别区域还原为矩形区域,通过自适应域值的二值化方法实现文字 前景与亮度变化背景之间分离,为文字识别方法提供良好的图像源。

本发明解决的主要技术问题是采用以下技术方案来实现的:

对照相机摄取的文字图片的文字区域几何失真进行区域校正,得到矩形区域的校正结 果;并将照相机摄取的文字图片中的文字前景和亮度不均的背景自适应地分离出来。

对照相机摄取的文字图片的文字区域几何失真进行区域校正的方法是:首先对照相机 摄取的具有几何失真的文本图像进行区域自动识别或指定,得出文本区域的边界位置,再 利用文本图像文字排列的固有矩形区域特性,对所识别或指定的文本区域进行几何校正, 还原为矩形形状的文本区域;对于文本图像中的任何一个像素,根据它与所指定的文本区 域的边界位置的关系,求取其在设定矩形区域中的对应位置,从而得到该像素在校正后图 像中的本源位置。校正后图像的所有像素的色彩值或亮度值均以其所对应的源文字图片中 的像素本源位置作为参照,通过任意一种图像插值算法确定;具体步骤如下:

1)对原本为矩形文字区域的图像进行文字区域识别,得出文本的边界;

2)以区域识别结果为基准,计算源图像相对于该基准下的位置关系;

3)通过任意一种图像插值算法确定校正后图像对应像素的色彩值或亮度值,从而得 出几何校正的结果;

4)对步骤3所得出的几何校正的结果还可重复步骤1、步骤2和步骤3,通过迭代 得到更好的几何校正的结果。

对照相机摄取的文字图片或由上述的文字区域几何失真校正方法所得出的结果图像 进行文字前景的提取,将文字前景和亮度不均的背景自适应地分离出来的方法是图像动态 域值二值化预处理方法:通过图像中任意像素及其邻域像素之间的运算,可使用但不限于 使用任意一种图像模糊方法,求取局部背景亮度;通过利用局部背景亮度的加权值作为该 区域的二值化门限,对该区域文字前景进行分离;根据分离结果,将源图像中的文字前景 部分扣除,再次使用但不限于使用任意一种图像模糊方法计算局部背景亮度,然后利用其 加权值作为新的动态门限对源图像进行二值化,得出更精确的分离结果;这一过程可以进 行多次迭代,具体步骤如下:

1)采用固定域值方法对文本前景进行粗分离;

2)利用任意一种图像模糊方法,对粗分离出来的背景区域求取其局部背景亮度;

3)对局部背景亮度进行加权计算,以之作为动态域值对原图像进行文献前景分离;

4)利用步骤3所得出的结果,重复迭代步骤2、3得出更精确的分离结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810058451.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top