[发明专利]用于文字识别的文本图像预处理方法无效

专利信息
申请号: 200810058451.5 申请日: 2008-05-27
公开(公告)号: CN101315664A 公开(公告)日: 2008-12-03
发明(设计)人: 邵玉斌 申请(专利权)人: 昆明理工大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46
代理公司: 昆明正原专利代理有限责任公司 代理人: 金耀生
地址: 650093云南*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 文字 识别 文本 图像 预处理 方法
【权利要求书】:

1.一种用于文字识别的文本图像预处理方法,其特征在于:对照相机摄取的文字图片 的文字区域几何失真进行区域校正,得到矩形区域的校正结果;并将照相机摄取的文字图 片中的文字前景和亮度不均的背景自适应地分离出来。

2.根据权利要求1所述的用于文字识别的文本图像预处理方法,其特征在于:对照 相机摄取的文字图片的文字区域几何失真进行区域校正的方法是:首先对照相机摄取的具 有几何失真的文本图像进行区域自动识别或指定,得出文本区域的边界位置,再利用文本 图像文字排列的固有矩形区域特性,对所识别或指定的文本区域进行几何校正,还原为矩 形形状的文本区域;对于文本图像中的任何一个像素,根据它与所指定的文本区域的边界 位置的关系,求取其在设定矩形区域中的对应位置,从而得到该像素在校正后图像中的本 源位置。校正后图像的所有像素的色彩值或亮度值均以其所对应的源文字图片中的像素本 源位置作为参照,通过任意一种图像插值算法确定;具体步骤如下:

1)对原本为矩形文字区域的图像进行文字区域识别,得出文本的边界;

2)以区域识别结果为基准,计算源图像相对于该基准下的位置关系;

3)通过任意一种图像插值算法确定校正后图像对应像素的色彩值或亮度值,从而得 出几何校正的结果;

4)对步骤3所得出的几何校正的结果还可重复步骤1、步骤2和步骤3,通过迭代 得到更好的几何校正的结果。

3.根据权利要求1所述的用于文字识别的文本图像预处理方法,其特征在于:对照相 机摄取的文字图片或由权利要求1所述的文字区域几何失真校正方法所得出的结果图像进 行文字前景的提取,将文字前景和亮度不均的背景自适应地分离出来的方法是图像动态域 值二值化预处理方法:通过图像中任意像素及其邻域像素之间的运算,可使用但不限于使 用任意一种图像模糊方法,求取局部背景亮度;通过利用局部背景亮度的加权值作为该区 域的二值化门限,对该区域文字前景进行分离;根据分离结果,将源图像中的文字前景部 分扣除,再次使用但不限于使用任意一种图像模糊方法计算局部背景亮度,然后利用其加 权值作为新的动态门限对源图像进行二值化,得出更精确的分离结果;这一过程可以进行 多次迭代,具体步骤如下:

1)采用固定域值方法对文本前景进行粗分离;

2)利用任意一种图像模糊方法,对粗分离出来的背景区域求取其局部背景亮度;

3)对局部背景亮度进行加权计算,以之作为动态域值对原图像进行文献前景分离;

4)利用步骤3所得出的结果,重复迭代步骤2、3得出更精确的分离结果。

4.根据权利要求1所述的用于文字识别的文本图像预处理方法,其特征在于几何校 正方法包含自动区域识别和手动区域指定两种。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810058451.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top