[发明专利]用于文字识别的文本图像预处理方法无效

申请号：	200810058451.5	申请日：	2008-05-27
公开（公告）号：	CN101315664A	公开（公告）日：	2008-12-03
发明（设计）人：	邵玉斌	申请（专利权）人：	昆明理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46
代理公司：	昆明正原专利代理有限责任公司	代理人：	金耀生
地址：	650093云南***	国省代码：	云南;53
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于文字识别文本图像预处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于文字识别的文本图像预处理方法，其特征在于：对照相机摄取的文字图片的文字区域几何失真进行区域校正，得到矩形区域的校正结果；并将照相机摄取的文字图片中的文字前景和亮度不均的背景自适应地分离出来。

2.根据权利要求1所述的用于文字识别的文本图像预处理方法，其特征在于：对照相机摄取的文字图片的文字区域几何失真进行区域校正的方法是：首先对照相机摄取的具有几何失真的文本图像进行区域自动识别或指定，得出文本区域的边界位置，再利用文本图像文字排列的固有矩形区域特性，对所识别或指定的文本区域进行几何校正，还原为矩形形状的文本区域；对于文本图像中的任何一个像素，根据它与所指定的文本区域的边界位置的关系，求取其在设定矩形区域中的对应位置，从而得到该像素在校正后图像中的本源位置。校正后图像的所有像素的色彩值或亮度值均以其所对应的源文字图片中的像素本源位置作为参照，通过任意一种图像插值算法确定；具体步骤如下：

1)对原本为矩形文字区域的图像进行文字区域识别，得出文本的边界；

2)以区域识别结果为基准，计算源图像相对于该基准下的位置关系；

3)通过任意一种图像插值算法确定校正后图像对应像素的色彩值或亮度值，从而得出几何校正的结果；

4)对步骤3所得出的几何校正的结果还可重复步骤1、步骤2和步骤3，通过迭代得到更好的几何校正的结果。

3.根据权利要求1所述的用于文字识别的文本图像预处理方法，其特征在于：对照相机摄取的文字图片或由权利要求1所述的文字区域几何失真校正方法所得出的结果图像进行文字前景的提取，将文字前景和亮度不均的背景自适应地分离出来的方法是图像动态域值二值化预处理方法：通过图像中任意像素及其邻域像素之间的运算，可使用但不限于使用任意一种图像模糊方法，求取局部背景亮度；通过利用局部背景亮度的加权值作为该区域的二值化门限，对该区域文字前景进行分离；根据分离结果，将源图像中的文字前景部分扣除，再次使用但不限于使用任意一种图像模糊方法计算局部背景亮度，然后利用其加权值作为新的动态门限对源图像进行二值化，得出更精确的分离结果；这一过程可以进行多次迭代，具体步骤如下：

1)采用固定域值方法对文本前景进行粗分离；

2)利用任意一种图像模糊方法，对粗分离出来的背景区域求取其局部背景亮度；

3)对局部背景亮度进行加权计算，以之作为动态域值对原图像进行文献前景分离；

4)利用步骤3所得出的结果，重复迭代步骤2、3得出更精确的分离结果。

4.根据权利要求1所述的用于文字识别的文本图像预处理方法，其特征在于几何校正方法包含自动区域识别和手动区域指定两种。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于昆明理工大学，未经昆明理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810058451.5/1.html，转载请声明来源钻瓜专利网。