[发明专利]一种基于直线连续性的文档图像来源判别方法有效
申请号: | 201410389826.1 | 申请日: | 2014-08-08 |
公开(公告)号: | CN104166843B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 宋永红;郁冲;张元林 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 西安智大知识产权代理事务所61215 | 代理人: | 何会侠 |
地址: | 710049*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于直线连续性的文档图像来源判别方法,首先对输入的二值图像进行边缘提取的操作,然后使用3*N的直线检测模板进行水平和竖直方向的直线段检测,并通过搜索得到完整的直线段以及直线段两端局部区域内的孤立噪声点;随后在检测到的直线段上进行双向的扩展搜索得到直线段对应的基底直线长度;最后根据基底直线的长度进行分类,并计算每一类中直线段长度和基底直线长度的比值作为特征,将孤立噪声点的数目和直线段数目的比值作为附加的特征添加后输入训练过的SVM分类器中进行分类,最终输出图像的类别;本发明针对了二值文档图像来源判别方法中的不足和空白,在保证没有误判的基础上,可以快速地区分大多数含有直线的文档图像。 | ||
搜索关键词: | 一种 基于 直线 连续性 文档 图像 来源 判别 方法 | ||
【主权项】:
一种基于直线连续性的文档图像来源判别方法,其特征在于:包括如下步骤:步骤1:对输入的二值图像进行边缘提取操作,输出去除填充部分的边缘图像;步骤2:直线段和孤立噪声点检测:对于步骤1输出的边缘图像首先使用3*N的直线检测模板进行像素长度为N的直线段检测,具体的检测过程为:使用一个和3*N的直线检测模板同样大小的窗口对整幅图像进行遍历搜索,当搜索的窗口中的内容和3*N的直线检测模板内容相同时,则标记为一条检测到的基本直线段,否则继续使用3*N的直线检测模板进行搜索;得到基本直线段后继续向后续方向搜索得到完整无断裂的直线段长度,然后在检测到的直线段两端的局部区域检测孤立噪声点的数目以用于后续分类特征的构造;步骤3:计算基底直线长度:在检测到的直线段上进行双向的扩展搜索,首先在直线段的一端搜索相邻3*1的区域,若此区域包含黑色像素点则将此点设为新的直线段末端,再搜索新的直线段末端相邻3*1的区域,如此反复操作直至相邻区域内不存在黑色像素点为止,然后在直线段的另一端进行同样的操作;最后输出基底直线长度即等于检测直线段长度加上双向扩展搜索的长度;步骤4:直线连续性特征构造和分类:检测得到的基底直线根据水平或竖直方向分为两大类;根据已检测得到的基底直线长度相对图像尺寸进行进一步分类,分为长、中、短三类基底直线,该分类通过阈值直接划分,这样水平和竖直方向分别有三类基底直线,共得到六类基底直线;然后在每一类基底直线中,对其中检测到的直线段计算直线段长度和其对应的基底直线长度的比值,再求取平均值即作为直线连续性的特征;通过步骤2检测到的孤立噪声点数目除以检测到的基本直线段数目得到的比值作为附加的一维特征,六类基底直线共输出六维特征,最后得到七维特征,将此七维特征输入至训练过后的SVM分类器中进行分类,最终输出图像的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410389826.1/,转载请声明来源钻瓜专利网。
- 上一篇:厚板智能材料设计方法
- 下一篇:一种基于图模型的中文微博客倾向性检索方法