[发明专利]一种基于显性与隐性线段检测的平面文档图像透视矫正方法在审
| 申请号: | 201710915701.1 | 申请日: | 2017-09-30 |
| 公开(公告)号: | CN107748887A | 公开(公告)日: | 2018-03-02 |
| 发明(设计)人: | 应自炉;朱健菲;陈鹏飞;陈俊娟;甘俊英;翟懿奎 | 申请(专利权)人: | 五邑大学 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 广州市红荔专利代理有限公司44214 | 代理人: | 吴伟文 |
| 地址: | 529020 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 显性 隐性 线段 检测 平面 文档 图像 透视 矫正 方法 | ||
技术领域
本发明涉及一种图像处理技术领域,尤其是一种基于显性与隐性线段检测的平面文档图像透视矫正方法。
背景技术
纸质文档数字化加工是利用扫描仪或数码相机将纸质实体转化为数字图像进而转换成完全可编辑的数字化文档的过程,是机器视觉领域的一项重要应用。
传统的纸质文档数字化加工过程中,出于效率与成本的考量,一般采用非接触式的相机拍照来实现。由于在相机成像的过程中相机与被拍摄平面文档的相对位置的变化,如相机与被拍摄平面图像的距离、角度的变化,尤其是针对大幅面的图像,通常会得到具有透视形变的数字图像,而透视矫正操作的含义就是把具有透视变形的图像通过单应变换转化为无透视形变的图像。
传统的文档图像透视变形矫正一般都是基于灭点检测来实现的,即对于原本水平方向(竖直方向)的平行线在透视形变图中会相交于一点,称之为水平方向(竖直方向)的灭点。
然而这种透视失真会严重影响到后续的文档图像版面分析,OCR(光学字符识别)等过程。因此如何消除文档成像的透视形变问题,尤其是在相机参数未知的情况下,仅仅根据图像的性质消除文档图像的透视形变对于文档分析与识别至关重要。
目前针对平面图像的透视矫正问题的解决方法有图像边界法、低秩矩阵纹理分析法、相机标定法、深度学习法等。
但是,图像边界法只针对矩形边界的文档而设计,仅考虑图像的边界作为变换信息并未考虑到图像的内容,这种方法往往会带来图像内容更严重的失真。
低秩矩阵纹理分析的方法能够充分发掘图像的几何纹理特征,但是这种方法的实际效果与图像内容相关,并且计算量较大,从而直接导致图像处理速度较慢。
相机标定的方法通过图像的几何线分析来估计灭点坐标,再通过灭点建模来估计相机内外参数,进而得到图像矫正的单应变换矩阵,该方法计算繁琐尤其是灭点估计的误差会导致最终的变换矩阵不够精确,如中国专利2007100883550,透视变形文档图像的矫正装置和矫正方法,通过以透视变形的文档图像为对象,对二值化图像采用连通域分析提取线段结构来估计出水平方向与竖直方向的灭点,首先这种方法得到的线段端点坐标与其所在直线方程都不够精确,加上灭点计算的误差累积,最终导致该方案并不理想;另外中国专利2011104358411,一种平面目标图像透视变形的矫正方法和系统,通过摄像环境参数计算垂直变形系数与水平变形系数,该解决方案并没有考虑图像透视投影畸变的同时还伴随着图像的旋转与错切变换,最终导致该方案的应用场景非常有限。
而深度学习的方法如空间变换网络(Spatial Transformer Network,STN)可以在一定程度上解决图像的透视问题,但是对图像内容的还原性较差。
发明内容
针对现有技术的不足,本发明提供一种基于显性与隐性线段检测的平面文档图像透视矫正方法,从而解决针对大幅面平面文档图像高分辨率相机成像的过程中,由于相机与被拍摄平面图像的距离、角度等因素造成的透视畸变问题。
本发明的技术方案为:一种基于显性与隐性线段检测的平面文档图像透视矫正方法,包括以下步骤:
S1)、通过相机采集纸质文档图片,记为透视畸变图像;
S2)、获取透视畸变图像的宽和高,宽为w,高为h,通过灰度变换将透视畸变图像变换为单通道的灰度图像;
S3)、通过LSD(Line Segment Detection)梯度聚类算法提取灰度图像内部的所有显性线段,并记录相应显性线段两端点的坐标,并用齐次坐标表示,若提取的显性线段数量小于4,或者不存在显性线段数,则通过自适应局部连接图(ALCM)提取文本行的隐性线段,并记录相应隐性线段的两端点的坐标,并用齐次坐标表示,如果显性线段的数量大于4,则无需再提取隐性线段,并将提取的显性线段或隐性线段存储到线段集合L={l1,l2,....li}中,其中,li={pi,qi},pi、qi为线段li两端点的坐标;
S4)、对步骤S3)中提取的显性线段或隐形线段进行长度、斜率的筛选,若线段长度满足L={li|li≥5},以及斜率满足则保留该线段,否则删除该线段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710915701.1/2.html,转载请声明来源钻瓜专利网。





