[发明专利]文本图像的几何校正方法、装置和双目立体视觉系统有效
| 申请号: | 201110007011.9 | 申请日: | 2011-01-13 |
| 公开(公告)号: | CN102592124A | 公开(公告)日: | 2012-07-18 |
| 发明(设计)人: | 林锦梅 | 申请(专利权)人: | 汉王科技股份有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 图像 几何 校正 方法 装置 双目 立体 视觉 系统 | ||
技术领域
本发明属于图像处理领域,涉及一种图像处理方法和装置,具体涉及一种文本图像的几何校正方法、装置和双目立体视觉系统。
背景技术
文本图像的采集,主要有两种方式:通过扫描仪对文本进行扫描;通过各种相机、摄像头进行拍摄。用扫描仪扫描时,通常要将书稿拆开或展平后再进行扫描,一般情况下不采用。若将书稿直接放在扫描仪上扫描或采用相机、摄像头直接拍摄时,由于书脊、厚度等因素,不可避免使文稿本身产生弯曲等畸变,既影响了图像美观,又影响了后续的OCR识别应用中的版面分析、行提取等处理过程,因此对拍摄得到的文本图像进行几何校正就变得至关重要。
目前一般文本图像几何校正的方法主要分为两类:一类是通过在图像上设置一些已知的参考点,根据参考点在畸变前后的映射关系进行几何校正,该方法一般的实现过程如下,在待拍摄文本上放置一个模板,拍摄模板图像,获取模板图像上的已知参考点,并与原始模板中的参考点建立映射关系,最后根据该映射关系进行几何校正;另一类方法则直接通过分析文本图像本身的特点进行校正,但该方法无法针对一般的非特定畸变图像进行处理,根据处理得到的该类图像的某些特征进行校正。
文本采集主要有两种用途,其一是为了资料的保存,通常用于某些珍贵的资料;其二是用于OCR识别。一般情况下,在图像数据采集过程中都会尽可能在横平竖直的角度采集书页文本图像,这样有利于后续的处理。
对于第一类方法,采用一定的模板附于文稿上进行扫描或者拍摄,无论在资料保存还是用于OCR识别,操作都不方便。谷歌公司根据已知的一个迷宫图案模板,利用一套包含两台相机和红外线的系统来解决书页文稿弯曲的问题,作法是将两台红外线相机从不同角度把红外图像拍摄下来,根据这些图像用已知的立体成像技术加以组合取得该图案的3D对应效果,该图案落在书页表面,根据图案的3D图形与书页的3D表面相互对应,从而将书页展平。该方法克服了模板在拍摄过程中放置的不便问题,但是该方法系统复杂,成本高昂。
对第二类方法,主要是依据文本中文本行的方向作为参考信息进行校正,这种方法较大程度上受到文本内容、排版的影响,对于排版复杂,既有文字,表格,又有花边、插图的文本图像,很难获得较好的校正效果。中国专利CN1804861A通过对图像进行游程涂黑处理,在游程图上划分区段,以段中规则部分带动不规则部分进行校正的方法,较好的解决了某一类文本图像的几何畸变问题。但是该类方法往往要先进行版面分析、二值化等预处理,这些预处理的结果直接影响畸变校正的质量,并且该类方法主要依赖文本行的信息,若文本中既有横排又有竖排的情况,则无能为力。
发明内容
本发明所要解决的技术问题是提出一种文本图像的几何校正方法、装置和双目立体视觉系统,采用双目立体视觉结合曲线拟合的方式重建文本图像,对于复杂图像有良好的校正效果,从而有效改善了图像的视觉效果,利于后续的OCR处理和识别。
本发明公开了一种文本图像的几何校正方法,包括如下步骤:
步骤一:搭建双目立体视觉系统,进行系统标定后获取双目立体视觉系统中两镜头各自的内部参数和相互的外部参数,求取两镜头各自的投影矩阵;
步骤二:对经标定的双目立体视觉系统中两镜头所采集的图像分别进行特征提取,根据提取到的图像特征进行立体匹配,并对得到的匹配点进行提纯;
步骤三:根据提纯得到的匹配点和标定后获得的内部参数、外部参数及投影矩阵,计算文本图像中对应点的三维坐标,从而判断文本图像中的文本走势方向;
步骤四:根据获得的文本走势方向拟合文本走势曲线,将文本走势曲线离散展开后进行图像重建,从而得到校正后的文本图像。
所述步骤一中双目立体视觉系统包括两台同样的第一镜头和第二镜头;第一镜头用于拍摄待校正的文本图像;第二镜头的视野包括第一镜头拍摄的文本图像。
所述步骤二中特征提取时,采用尺度不变特征变换方法进行特征提取。
所述步骤二中对得到的匹配点进行提纯时,对匹配点连线的角度进行统计,将180°划分为n个区间,统计所有匹配点连线角度落入各个区间的个数,取点个数最多的角度区间作为匹配点连线角度的范围进行初步提纯,然后根据初步提纯后的匹配点间的平均距离进行设定,如果
其中,T为设定的阈值,为当前匹配点的距离,为匹配点间的平均距离,则当前匹配点为提纯得到的匹配点。
所述区间n为36,设定的阈值T为0.1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110007011.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





