[发明专利]基于能量最小化框架的文档图像倾斜度检测与纠正方法有效
| 申请号: | 201310321375.3 | 申请日: | 2013-07-22 |
| 公开(公告)号: | CN103400130A | 公开(公告)日: | 2013-11-20 |
| 发明(设计)人: | 邬向前;卜巍;唐有宝 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 能量 最小化 框架 文档 图像 倾斜度 检测 纠正 方法 | ||
技术领域
本发明涉及文档分析与应用领域,具体涉及一种基于能量最小化框架的文档图像倾斜度检测与纠正方法。
背景技术
随着数字化技术的不断发展,电子文档的出现在人们日常生活中变得越来越流行,比如使用相机或扫描仪来记录管理日志,存储历史文件等。相对纸质文档,电子文档具有方便性,永久性等优势。在获取或采集电子文档图像时,发生一定的倾斜是不可避免。然而,大部分文档系统(例如光学字符识别,文档页面布局分析等)对文档图像的倾斜度是敏感的。因此,倾斜度检测和纠正在文档图像分析与应用领域中变成一个重要的问题。为了纠正倾斜度,在数字化过程中,文档对齐预处理操作是必要的。
文档图像可以分为两种:手写文档图像和机打文档图像。当在一个不受约束的条件下书写文本时,从手写文档图像中检测倾斜度是一个相对困难的任务。相对手写文档图像,机打文档图像通常是规则排列的而且内容具有多样性(文字,表格,图像等等)。尽管目前已有大量科研人员在研究机打文档图像的倾斜度检测和纠正方法,但是它仍然是一个具有挑战性的问题。
发明内容
基于以上不足之处,本发明提出了一种基于能量最小化框架的文档图像倾斜度检测和纠正方法,该方法的研究对象为机打文档图像,文档图像中的内容可以是文字、表格、图片等。本发明首先需要使用扫描仪将文档扫描成电子文档图像,然后估算前景像素状态信息,然后利用前景像素状态信息构建能量函数,然后利用图像处理技术和直线拟合技术计算初始的倾斜度,最后进行能量最小化过程得到最终的倾斜度并将文档图像进行纠正。
该方法包括三个过程,具体如下:
(1)计算前景像素状态信息
在计算前景像素状态信息之前,首先对扫描得到的文档图像进行二值化,用黑色表示前景,白色表示背景像素,给定一个前二值文档图像I之后,前景像素的状态计算过程如下:一个边界框定义为一个文档图像的边界,用P记作整个前景像素的集合,(W,H)记作文档图像I的大小,那么对每一个前景像素p∈P,它的状态信息为sp=(xp,yp,wp,hp),其中xp,yp,wp,hp分别为p到图像最左、最上、最右和最下边的距离;
(2)利用直线拟合技术估算初始倾斜度
接下来利用文档图像中最外围的前景像素的状态信息来估算初始倾斜度,一个边界框有四个边:上、下、左和右,对每一边都能得到其最外围的前景像素状态信息子集,用以下方式得到上边最外围前景像素状态信息子集,记为
yi∈si∩yi=min{yp|yp∈sp∩xp∈sp∩xp=i}.
将TS中每个元素的xp做为x坐标,yp作为y坐标画图,图中下面的点拟合成一条直线,边界框剩下的三边都经过该处理,将使用直线拟合的技术来估算文档图像的初始倾斜度,在直线拟合之前先对TP进行采样,用如下方式将TP划分为N个互不重叠的部分STSi:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310321375.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于安装数控刀架安装钻头的装置
- 下一篇:电机壳立式铸造模具





