[发明专利]一种基于基线估计的藏文历史文献文本行切分方法有效
申请号: | 201710849135.9 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107730511B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 段立娟;李颜兴 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/194;G06T3/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种对藏文历史文献文本行切分的方法。通过提取藏文历史文献的左侧部分图像,去除藏文元音音节点和某些突出的笔画,获取藏文文本行基线的起始位置信息以及文本行数;根据基线的起始位置,自左向右建立基线,在基线建立的过程中需要根据周围点的像素值动态调整基线;利用估计好的基线,采用连通区域分析法,从两基线之间确定粘连区域的位置并进行切分,最终分离出文本行。本发明提出的一种基于基线估计的藏文历史文献文本行切分方法更加适用于藏文历史文献文本行的切分,比传统的基于投影切分的技术切分精确度高。比起只使用基于投影切分的方式,本发明方法的切分出来的文本行正确率更高。 | ||
搜索关键词: | 一种 基于 基线 估计 藏文 历史文献 文本 切分 方法 | ||
【主权项】:
一种基于基线估计的藏文历史文献文本行切分方法,其特征在于:步骤1,提取输入图像的左侧部分图像;从输入的藏文历史文献图像中提取左侧1/4部分图像,用以分析并提取文本行的基线位置及行数,并将该图像命名为图像A;步骤2,去除藏文元音音节点和某些突出的笔画;通过大小N*M滑动窗口将输入图像切分图像块,其中宽度N为图像中藏文字丁的宽度,长M为宽度N的2倍;从图像块中选取至少80个顶部含有基线的图像块作为模板,使用主成分分析法获取其13维特征;以同样大小的滑动窗口对图像A进行模板匹配,保留图像A中和任意模板相似度大于0.9的图像块,否则将其设置为背景色;得到图像B;步骤3,获取藏文文本行基线的起始位置信息以及文本行数;二值化原始图像,令前景点像素值为1,背景点像素值为0,水平投影图像B,并获得其中连续的投影值不为0的区域,分别计算每个区域的最大投影值Mi;将各区域与中投影值小于Mi/2的行内像素替换成背景色,得到图像C;对图像C进行闭运算得到图像D,获取图像D的水平投影中的连续不为0的投影区域,投影区域的个数即为文本换行的个数,每个投影区域的上边界即为建立基线的起始位置;步骤4,建立基线;从基线起始位置开始到图像末尾结束,自左向右每隔5个像素点,选取一个像素点作为追踪点;选择上一个追踪点右方水平第5个像素点及该点上下各两个点为下一个追踪点的候选点,分别将水平点命名为P,上方两个点U1、U2,下方两个点D1、D2;根据以下规则从上至下依次判断计算出下一个追踪点:1).若P、U1、U2、D1、D2的像素值相同,选取P为下一个追踪点;2).否则,若P为背景点,且D1或D2为前景点,选取D1为下一个追踪点;3).否则,若P为前景点,且U1或U2为背景点,选取U1为下一个追踪点;4).其他,选取P为下一个追踪点;基线由追踪点自左向右相连得出;步骤5,确定粘连区域的位置;基于步骤4中建立的基线,将原始图像切分成多个文本行条;然后,每隔90~120像素,将文本行条切分成图像块,保证每个图像块位于上下两条基线之间;分析图像块中的连通区域的高度,若图像块中存在大于其高度的9/10的连通区域,则认为该图像块为粘连图像块,需要进一步处理;否则将和下基线相连的连通区域标记为下一行,其余的标记为本行;步骤6,切分粘连区域;将步骤5中得到的粘连块进行距离变换处理,并对处理后的图像进行水平投影;从投影中找到最小值对应的行作为切分行所在的位置,将切分行下方的前景区域标记为下一行,其余区域标记为本行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710849135.9/,转载请声明来源钻瓜专利网。
- 上一篇:用于医院的数据信息交换方法
- 下一篇:一种半自动外周血管检测操作系统