[发明专利]发行公告版面分析方法在审
申请号: | 202110403839.X | 申请日: | 2021-04-15 |
公开(公告)号: | CN113033541A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 周玉飞 | 申请(专利权)人: | 北京合众鼎成科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京世誉鑫诚专利代理有限公司 11368 | 代理人: | 郭官厚 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发行 公告 版面 分析 方法 | ||
1.发行公告版面分析方法,其特征在于:包括以下步骤:
S1.将待分析图像输入训练好的目标检测模型中;
S2.判断待分析图像中是否包含表格元素和图元素,如果包含则调整表格和图元素位置并进行下一步,不包含则进行步骤S4;
S3.调整所有与图、表格元素有重叠的元素位置;
S4.利用投影法计算文本行位置;
S5.标记文本行所属版面元素,同时调整对应的版面元素位置;
S6.判断是否需要分栏,并计算分栏位置;
S7.对版面元素进行排序;
S8.输出结果。
2.根据权利要求1所述的发行公告版面分析方法,其特征在于:所述发行公告版面分析方法选择Faster-RCNN深度学习框架结构来检测版面元素,该方法将版面元素分为页眉、页脚、文本段落、图和表格5类,标注8300张样本上的版面元素类别和位置,用标注好的样本训练Faster-RCNN模型。
3.根据权利要求1所述的发行公告版面分析方法,其特征在于:所述S2中调整表格元素位置的具体步骤包括:以深度学习模型输出的表格位置为基准进行扩大和缩小,扩大1.3倍得到位置A,缩小0.7倍得到位置B,在原始输入图像上裁切位置A和位置B之间的部分,二值化后,用直线段检测算法检测并合并直线,根据检测到的直线坐标调整表格元素的位置,如果没有检测到直线,通过纵向和横向投影定位文本行,根据文本位置调整表格元素的位置。
调整图元素位置的具体步骤包括:以模型输出的图元素位置为基准扩大1.3倍得到位置C,由于图片与文档图像的背景之间通常有明显梯度,在上下左右四个方向上以滑动窗口的的方式寻找灰度值第一次发生突变的位置作为当前方向的图元素边界,最终得到调整后的图元素的位置。
4.根据权利要求1所述的发行公告版面分析方法,其特征在于:所述S3后还包括以下步骤:如果版面含有图或者表格元素,将原图中调整后的表格或图位置置为背景,更新后的输入图像最多只有页眉页脚和文本段落三个类别的元素。
5.根据权利要求1所述的发行公告版面分析方法,其特征在于:所述S4中计算文本行位置的具体方式包括:二值化更新后的样本图片,用10*1的核心对其腐蚀,使得文字可以连续成行,在竖直方向和水平方向上进行投影,获取文本行的位置坐标。
6.根据权利要求1所述的发行公告版面分析方法,其特征在于:所述S5的具体步骤包括:
a.遍历网络模型输出的非表格和图元素D,筛选出D中互相有重叠的元素,计算重叠区域坐标,根据重叠区域与文本行的交并比,筛选出重叠区域内的文本行,以任意一条文本行的起点纵坐标为边界分割重叠的版面元素;
b.计算D与每条文本行E的交并比,当交并比大于0.5,并且文本长度大于当前版面元素D的宽度的50%时,标记当前文本行E属于当前版面元素D;对于不与任何版面元素相交的文本行,计算其中心位置与所有版面元素D中心位置的距离,标记其属于距离最近的版面元素;
c.标记完所有文本对应版面元素之后,在水平方向计算每个版面元素下属的文本行的起点和终点平均值,更新版面元素的左右位置为计算得到的平均值,上下位置为竖直方向上每个版面元素下属文本行坐标的最小和最大值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京合众鼎成科技有限公司,未经北京合众鼎成科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110403839.X/1.html,转载请声明来源钻瓜专利网。