[发明专利]一种文档排版类型的检测方法及系统有效
申请号: | 201110445793.4 | 申请日: | 2011-12-28 |
公开(公告)号: | CN102567732A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 胡希驰 | 申请(专利权)人: | 方正国际软件有限公司;方正国际软件(北京)有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 215123 江苏省苏州市工*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文档排版类型的检测方法及系统,属于文档排版类型检测领域。本发明所述的方法及系统,依据文档中字行/列的平行性、周期性以及行间距大于字间距等特点,以文字连通域最小外接矩形的中心点坐标作为Hough变换的输入点集,在Hough变换的参数空间进行投票,对投票极值点进行周期性分析,通过参数空间中极大值点在不同方向上的周期性,确定文档的排版类型。通过本发明所述的方法及系统实现了对文档中各种排版情况中排版类型的确认。 | ||
搜索关键词: | 一种 文档 排版 类型 检测 方法 系统 | ||
【主权项】:
一种文档排版类型的检测方法,包括以下步骤:(1)选定待检测的文档图像,并对所述文档图像进行二值化处理得到二值化图像;(2)计算二值化图像的连通域,并计算连通域的最小外接矩形以及最小外接矩形的中心点坐标;(3)将所述最小外接矩形的中心点坐标作为Hough变换计算的输入点集,在Hough变换参数空间投票计算累加矩阵A(θ,ρ);其中,累加矩阵A(θ,ρ)以θ为X轴,θ表示文档图像的每行或每列的最小外接矩形的中心点所在直线的法线与X轴正半轴的夹角,0≤θ≤180;ρ表示文档图像空间的每行或每列的最小外接矩形的中心点所在直线与X轴的距离,‑r≤ρ≤+r,r为文档图像对角线长度的一半;(4)检测累加矩阵的投票极值点,并对极值点进行周期性分析,根据极值点在不同θ方向上的周期性确定文档的排版类型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方正国际软件有限公司;方正国际软件(北京)有限公司,未经方正国际软件有限公司;方正国际软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110445793.4/,转载请声明来源钻瓜专利网。