[发明专利]一种基于直线连续性的文档图像来源判别方法有效
申请号: | 201410389826.1 | 申请日: | 2014-08-08 |
公开(公告)号: | CN104166843B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 宋永红;郁冲;张元林 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 西安智大知识产权代理事务所61215 | 代理人: | 何会侠 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 直线 连续性 文档 图像 来源 判别 方法 | ||
技术领域
本发明涉及文档图像来源判别方法技术领域,具体涉及一种基于直线连续性的文档图像来源判别方法。
背景技术
文档图像根据其制作来源可分为扫描图像和栅格图像。而图像存储时根据其每个像素存储的信息量可以分为彩色图像、灰度图像和二值图像。
目前针对文档图像来源判别的算法研究主要可以分为三类:
一是基于文档倾斜检测的方法,主要针对早期的扫描文档图像多出现整体倾斜的情况。该类方法一般先获取一整行文字行或文字行间的空白区域,通过投影及直线拟合的方法来计算文字行和水平方向间的角度,通过这个角度来刻画文档图像的倾斜情况。但是由于现在的扫描仪在扫描文档之前都会对纸张进行一个对齐操作,图像倾斜的情况也出现的越来越少,仅仅根据这一方法很难区分图像的来源。
二是基于模糊检测的方法,主要针对扫描图像相对于栅格图像会存在模糊边缘的情况。该类方法首先会提取图像的一个边缘,然后对不同方向求取边缘部分的梯度,从而推测出边缘的宽度,通过边缘宽度来刻画模糊的程度。然而在处理二值图像时,由于只存在0和1两种值,模糊情况无法得到有效的刻画,这类方法基本无法用于判别其来源。
三是基于噪声滤波的方法,主要利用扫描仪传感器在成像时形成的噪声来判别其来源。该类方法通过使用不同的滤波器对输入图像进行滤波操作,再将滤波后的图像与原图相减,从而构成噪声特征,最后将不同滤波得到的噪声特征输入到分类器中进行分类来得到图像来源判别的结果。但滤波在处理信息量较少的二值图像时很难得到一个理想的结果,并且一些栅格图像存在半色调来表征灰色图案的情况,更加误导了滤波后的结果,最终导致最后的分类不准确。
发明内容
为了解决上述现有技术存在的问题,本发明的目的在于提供一种基于直线连续性的文档图像来源判别方法,对二值文档图像能够有效地判断其制作来源。
为达到以上目的,本发明采用如下技术方案:
一种基于直线连续性的文档图像来源判别方法,包括如下步骤:
步骤1:对输入的二值图像进行边缘提取操作,输出去除填充部分的边缘图像;
步骤2:直线段和孤立噪声点检测:对于步骤1输出的边缘图像首先使用3*N的直线检测模板进行像素长度为N的直线段检测,具体的检测过程为:使用一个和3*N的直线检测模板同样大小的窗口对整幅图像进行遍历搜索,当搜索的窗口中的内容和3*N的直线检测模板内容相同时,则标记为一条检测到的基本直线段,否则继续使用3*N的直线检测模板进行搜索;得到基本直线段后继续向后续方向搜索得到完整无断裂的直线段长度,然后在检测到的直线段两端的局部区域检测孤立噪声点的数目以用于后续分类特征的构造;
步骤3:计算基底直线长度:在检测到的直线段上进行双向的扩展搜索,首先在直线段的一端搜索相邻3*1的区域,若此区域包含黑色像素点则将此点设为新的直线末端,再搜索新的直线末端相邻3*1的区域,如此反复操作直至相邻区域内不存在黑色像素点为止,然后在直线段的另一端进行同样的操作;最后输出基底直线长度即等于检测直线段长度加上双向扩展搜索的长度;
步骤4:直线连续性特征构造和分类:检测得到的基底直线根据水平或竖直方向分为两大类;根据已检测得到的基底直线长度相对图像尺寸进行进一步分类,分为长、中、短三类基底直线,该分类通过阈值直接划分,这样水平和竖直方向分别有三类基底直线,共得到六类基底直线;然后在每一类基底直线中,对其中检测到的直线段计算直线段长度和其对应的基底直线长度的比值,再求取平均值即作为直线连续性的特征;通过步骤2检测到的孤立噪声点数目除以检测到的基本直线段数目得到的比值作为附加的一维特征,六类基底直线共输出六维特征,最后得到七维特征,将此七维特征输入至训练过后的SVM分类器中进行分类,最终输出图像的类别。
所述3*N的直线检测模板为高度为3个像素且宽度为N个像素的矩形图像模板,其中除中间一行的像素值为1外其余像素值均为0。
所述根据已检测得到的基底直线长度相对图像尺寸进行分类的方法为:当基底直线为水平方向时,求取基底直线长度和图像宽度的比值与阈值进行比较;当基底直线为竖直方向时,求取基底直线长度和图像高度的比值与阈值进行比较。
本发明和现有技术相比,具有如下优点:
1、本发明的主要思想是将文档图像中的直线检测出来,同时扩展得到直线基底,通过对两者的比值构造特征,最后通过训练好的分类器进行分类。经过测试,本方法在保证没有误判的基础上,可以快速地区分大多数含有直线的文档图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410389826.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:厚板智能材料设计方法
- 下一篇:一种基于图模型的中文微博客倾向性检索方法