[发明专利]版面分析方法和装置有效
| 申请号: | 201510696674.4 | 申请日: | 2015-10-23 |
| 公开(公告)号: | CN105373790B | 公开(公告)日: | 2019-02-05 |
| 发明(设计)人: | 兴百桥;刘正珍 | 申请(专利权)人: | 北京汉王数字科技有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20 |
| 代理公司: | 北京瑞盟知识产权代理有限公司 11300 | 代理人: | 刘昕 |
| 地址: | 100193 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 版面 分析 方法 装置 | ||
本发明涉及一种版面分析方法和装置,该版面分析方法包括以下步骤:输入包括多个版面元素的待处理图像;在每个版面元素所在的区域内绘制封闭曲线;自适应调整所述封闭曲线至所述版面元素的边缘;根据自适应调整至所述版面元素边缘的封闭曲线从所述待处理图像中提取每个版面元素。
技术领域
本发明涉及图像处理,特别涉及一种版面分析方法和装置。
背景技术
文档图像的版面分析是文档信息处理系统的重要组成部分,以及复杂文档光学字符识别(OCR)必不可少的环节,它是实现纸质文档数字化的重要环节。
版面分析技术广泛应用于文档自动检索、办公自动化等领域。版面分析主要包括版面分割和区域类型识别两大部分。
近年来,随着数字化加工技术的发展,自动版面分析技术也越来越成熟。但是对于复杂的报纸版面,由于版面元素类型多样,版面布局复杂,能适应所有报纸版面的全自动的版面分析技术比较少,至今为止在文字识别领域还不存在能够适应各种应用场景的通用的版面分析器。
现有的自动版面分析方法需要非常复杂的算法,而且无法提供很高的精度。因此发展出了人工指定版面元素的方法。
例如,CN103336961A提出了一种交互式自然场景文本检测方法,通过人工绘制一条线,根据这条线在版面图像中选取一个扩展区域,在这个扩展区域中通过具体分析最终得到文本区域。这种方法适用于把一幅图中图像上的文字区域提取出来、识别文字、使计算机理解图像内容。
然而,这种交互式自然场景文本检测方法对于选取图像或广告时往往会不完整,因为这种方法检测的是图像中的文本区域,如果图像中没有文本往往会得到错误的区域。对于选取正文,由于该方法对标记线进行扩展没有利用正文的信息,而是一律向上向下扩展待测图像高度的1/3,向左向右扩展标记线长度的1/3,因此得到的是粗略文本区域,无法进行精确的版面提取和分析。
鉴于现有技术中的上述不足,需要提出一种能够快速有效准确地标记并识别各个版面元素的版面分析方法。
发明内容
本发明提出了一种版面分析方法和装置,能够快速有效准确地标记并识别各个版面元素。
根据本发明的第一方面,一种版面分析方法包括以下步骤:输入步骤,输入包括多个版面元素的待处理图像;绘制步骤,在每个版面元素所在的区域内绘制封闭曲线;自适应调整步骤,将所述封闭曲线自适应调整至所述版面元素的边缘;提取步骤,根据自适应调整至所述版面元素的边缘的所述封闭线圈从所述待处理图像中提取每个版面元素。
根据本发明的第二方面,所述封闭曲线为矩形框,该矩形框包括沿第一方向延伸的第一对边和沿第二方向延伸的第二对边;并且所述自适应调整步骤包括将所述第一对边和所述第二对边自适应调整至所述版面元素的边缘;所述提取步骤包括根据自适应调整至所述版面元素的边缘的所述第一对边和所述第二对边从所述待处理图像中提取每个版面元素。
根据本发明的第三方面,所述版面元素包括图片、标题和正文,并且,所述自适应调整步骤包括:判断所述第一对边和所述第二对边是在空白处还是压住图片或压住标题或正文的文字;如果压住图片或压住标题或正文的文字,则进行第一扩展,将所述第一对边和所述第二对边扩展至所述版面元素的边缘;如果在空白处,则执行第一收缩,将所述第一对边和所述第二对边收缩至所述版面元素的边缘。
根据本发明的第四方面,针对标题和正文预先定义了高度阈值和宽度阈值,高度和宽度分别大于所述高度阈值和所述宽度阈值的版面元素被视为正文,在进行了第一扩展或第一收缩之后,判断所述矩形框的高度和宽度是否大于高度阈值和宽度阈值;如果是,则判断所述版面元素为正文,进行第二扩展和第三扩展;如果否,则判断所述版面元素为标题,不进行第二扩展和第三扩展,其中,所述第二扩展包括将所述第一对边在所述第一方向上扩展至所述版面元素的边缘;所述第三扩展包括将所述第二对边在所述第二方向上扩展至所述版面元素的边缘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京汉王数字科技有限公司,未经北京汉王数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510696674.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:设备状态的图像监测方法及装置
- 下一篇:瞳孔定位方法与装置





