[发明专利]版面分栏方法及装置有效
申请号: | 201711365896.3 | 申请日: | 2017-12-18 |
公开(公告)号: | CN107943780B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 胡雨隆;胡金水 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/189 | 分类号: | G06F40/189 |
代理公司: | 北京华圣典睿知识产权代理有限公司 11510 | 代理人: | 陈国伟 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 版面 分栏 方法 装置 | ||
1.一种版面分栏方法,其特征在于,所述方法包括:
获取待分栏文本图像;
对所述文本图像进行文本行切分,得到各文本行;
对所述文本行进行合并成栏处理,得到最终分栏结果;
所述对所述文本行进行合并成栏处理,得到最终分栏结果包括:
将各文本行作为独立的文本栏,存入到文本栏集合中作为当前分栏结果,并计算当前分栏代价;所述分栏代价包括:栏内代价和栏间代价;所述栏内代价是指文本栏内相邻文本行属于同一栏的代价;所述栏间代价是指当前文本栏与其相邻文本栏为独立栏的代价;
依次对相邻文本栏进行合并,并计算合并后的分栏代价,得到其中的最小分栏代价,并根据所述最小分栏代价及当前分栏代价更新分栏结果及当前分栏代价;
所有相邻文本栏合并完成后,得到最终分栏结果。
2.根据权利要求1所述的方法,其特征于,所述依次对相邻文本栏进行合并,并计算合并后的分栏代价,得到其中的最小分栏代价,并根据所述最小分栏代价及当前分栏代价更新分栏结果及当前分栏代价包括:
(1)依次选择当前分栏结果中的一个文本栏作为当前文本栏进行预测:将当前文本栏与其相邻文本栏合并后的文本栏作为预测文本栏,得到预测分栏结果,计算对应所述预测分栏结果的预测分栏代价,并得到其中的最小预测分栏代价;
(2)判断所述最小预测分栏代价是否小于当前分栏代价;
(3)如果是,则更新当前分栏结果为所述最小预测分栏代价对应的预测分栏结果,并更新当前分栏代价为所述最小预测分栏代价,然后执行步骤(1);
(4)否则,将当前分栏代价作为最小分栏代价;
所述所有相邻文本栏合并完成后,得到最终分栏结果包括:
所有相邻文本栏合并完成后,将所述最小分栏代价对应的当前分栏结果作为最终分栏结果。
3.根据权利要求2所述的方法,其特征在于,所述计算预测分栏代价包括:
计算所述预测文本栏的栏内代价;
计算所述预测文本栏的栏间代价;
根据所述栏内代价和所述栏间代价得到预测分栏代价。
4.根据权利要求3所述的方法,其特征在于,所述计算所述预测文本栏的栏内代价包括:
基于预先构建的栏内代价模型分别计算所述预测文本栏内每两个相邻文本行属于同一栏的代价值;所述栏内代价模型的输入为以下任意一项或多项:两个相邻文本行的间距、X轴重叠比例、X轴长度比例;所述栏内代价模型的输出为两个相邻文本行属于同一栏的代价值;
将得到的所有代价值取平均值,将该平均值作为所述预测文本栏的栏内代价。
5.根据权利要求3所述的方法,其特征在于,所述计算所述预测文本栏的栏间代价包括:
基于预先构建的栏间代价模型计算所述预测文本栏与各相邻文本栏不属于同一栏的代价值;所述栏间代价模型的输入为以下任意一项或多项:所述预测文本栏与相邻文本栏内像素外接凸包间的最小距离、X轴重叠比例、Y轴重叠比例、X轴长度比例、Y轴长度比例;所述栏间代价模型的输出为两相邻文本栏作为独立栏的代价值;
将得到的所有代价值取平均值,将该平均值作为所述预测文本栏与其相邻文本栏的栏间代价。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述相邻文本栏是指设定范围内的所有文本栏。
7.一种版面分栏装置,其特征在于,所述装置包括:
图像获取模块,用于获取待分栏文本图像;
切分模块,用于对所述文本图像进行文本行切分,得到各文本行;
分栏处理模块,用于将各文本行作为独立的文本栏,存入到文本栏集合中作为当前分栏结果,并计算当前分栏代价;依次对相邻文本栏进行合并,并计算合并后的分栏代价,得到其中的最小分栏代价;并根据所述最小分栏代价及当前分栏代价更新分栏结果及当前分栏代价;所有相邻文本栏合并完成后,得到最终分栏结果;其中,所述分栏代价包括:栏内代价和栏间代价;所述栏内代价是指文本栏内相邻文本行属于同一栏的代价;所述栏间代价是指当前文本栏与其相邻文本栏为独立栏的代价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711365896.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于数字出版的动态可配置的系统和方法
- 下一篇:关键词识别方法及装置