[发明专利]一种基于内容的文档图像倾斜角估计方法有效
申请号: | 201210391456.6 | 申请日: | 2012-10-16 |
公开(公告)号: | CN102938062A | 公开(公告)日: | 2013-02-20 |
发明(设计)人: | 马磊;刘江;陈霞 | 申请(专利权)人: | 山东山大鸥玛软件有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张维斗 |
地址: | 250101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 内容 文档 图像 倾斜角 估计 方法 | ||
技术领域
本发明涉及文档电子测量处理范畴,特别是一种文档图像倾斜角测量的估计方法,具体是一种基于内容的文档图像倾斜角估计方法。
背景技术
文档作为信息的载体,在社会生活中占有着十分重要的地位,其可以通过扫描仪、数码相机或文档处理系统进入计算机,转化为文档图像或者电子文档,从而使人们能够方便有效地对其进行存储、管理、传输。
现实生活中,由于扫描仪等走纸设备的机械误差或人为因素的影响,获取到的文档图像通常会出现某种程度的倾斜。而文档处理系统要求的处理对象是工整的,或者倾斜角度已知的文档图像,否则对图像的许多操作,如投影分析、图像分割等就无法进行。
因此,倾斜角检测是文档图像处理中非常重要的组成部分,是图像分析、识别的基础,特别是在光标字符识别实时系统中,识别的性能直接和图像数据的质量相关。因此充分利用现有的图像处理手段,解决文档图像扫描过程的倾斜问题,在提高文档信息采集,录入准确性、减少拒识率,提高产品的易操作性和可靠性方面具有重要的研究意义。
目前,文档图像倾斜校正方法主要可分为三类:投影方法、Hough变换法和近邻法,此外还有矩形块邻接图算法、基于子空间直线段检测法、基于梯度分析法、神经网络法等。
而大多数图像识别技术中使用的倾斜校正方法的计算精度在很大程度上受图像纹理的影响,又文档种类繁多且版面十分复杂,包含文字、表格、图像、图形等,通用的文档图像倾斜角估计方法很难建立。
文献《基于内容的文档图像倾斜校正》中公布了一种文档图像倾斜角估计方法,但其对文档图像采用游长平滑预处理,使文字行连成一个连通的区域,这种方式在检测直线段时只能检测表格对应的直线段,通用性不强;且其选用文档中的最长线段为有效直线段进行文档图像倾斜角的估算,保证了计算速度的同时却降低了其准确度。此为现有技术的不足之处。
发明内容
本发明所要解决的技术问题,就是针对现有技术所存在的不足,提供一种不但能够估计有直线段的文档图像倾斜角,还能估计没有直线段的文档图像的倾斜角,并精度高、稳定性好且通用性强的文档图像倾斜角估计方法。
本发明的技术解决方案是:一种基于内容的文档图像倾斜角估计方法,步骤如下:
(1)获取文档图像;
(2)对文档图像进行二值化;
(3)用直线段检测方法检测二值化图像中各直线段;
(4)用细化算法细化步骤(3)中得到的各直线段;
(5)设定阈值,用8连通域标记方法标记细化后的各直线段,并判断文档图像中是否存在有效直线段,若存在直线段长度大于或等于给定阈值的直线段,则相应的直线段为有效直线段,保留各有效直线段,并转至执行步骤(9),否则继续向下执行步骤(6);
(6)使用平滑算法平滑该文档图像;
(7)用高斯二阶导数函数的小波变换确定平滑文档图像的各文本行中心线;
(8)设定阈值,用8连通域标记方法标记文本行中心线,并判断文档图像中是否存在有效中心线,若存在中心线长度大于或等于给定阈值的中心线,则相应的中心线为有效中心线,保留各有效中心线,继续执行步骤(9),否则转至步骤(11);
(9)用投票算法统计各有效直线段或/有效中心线的倾斜角度分布函数;
(10)用高斯小波变换的突变信号检测方法进行各倾斜角度分布函数的突变信号分析;
(11)计算出文档图像倾斜角。
其中:所述步骤(9)中的投票算法用于统计同一有效直线段或/有效中心线中满足给定阈值的两像素之间倾斜角度的分布情况;所述步骤(10)中的高斯小波变换的突变信号检测方法用于计算各有效直线段或/有效中心线的倾斜角度;所述步骤(11)中依据各有效直线段或/有效中心线倾斜角度在文档图像倾斜角中所占 的权重计算出文档图像倾斜角,且计算公式如下:
其中, 为文档图像倾斜角, Mi/M为各有效直线段或/有效中心线的权重,ηi为各有效直线段或/有效中心线相应的倾斜角,i为文档图像中有效直线段或/有效中心线的条数且i=1,2,…,n。
进一步地,所述步骤(5)与步骤(8)中给定的阈值可以为32个像素、48个像素或64个像素;所述步骤(9)中用于统计各倾斜角度分布函数的阈值可以为16个像素。
本发明与现有技术相比的优点在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东山大鸥玛软件有限公司,未经山东山大鸥玛软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210391456.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序