[发明专利]一种基于基线估计的藏文历史文献文本行切分方法有效
| 申请号: | 201710849135.9 | 申请日: | 2017-09-20 |
| 公开(公告)号: | CN107730511B | 公开(公告)日: | 2020-10-27 |
| 发明(设计)人: | 段立娟;李颜兴 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/194;G06T3/00 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 基线 估计 藏文 历史文献 文本 切分 方法 | ||
1.一种基于基线估计的藏文历史文献文本行切分方法,其特征在于:
步骤1,提取输入图像的左侧部分图像;
从输入的藏文历史文献图像中提取左侧1/4部分图像,用以分析并提取文本行的基线位置及行数,并将提取左侧1/4部分图像命名为图像A;
步骤2,去除藏文元音音节点和突出的笔画;
通过大小N*M滑动窗口将输入图像切分图像块,其中宽度N为图像中藏文字丁的宽度,长M为宽度N的2倍;从图像块中选取至少80个顶部含有基线的图像块作为模板,使用主成分分析法获取其13维特征;以同样大小的滑动窗口对图像A进行模板匹配,保留图像A中和任意模板相似度大于0.9的图像块,否则将其设置为背景色;得到图像B;
步骤3,获取藏文文本行基线的起始位置信息以及文本行数;
二值化原始图像,令前景点像素值为1,背景点像素值为0,水平投影图像B,并获得其中连续的投影值不为0的区域,分别计算每个区域的最大投影值Mi;将各区域与中投影值小于Mi/2的行内像素替换成背景色,得到图像C;对图像C进行闭运算得到图像D,获取图像D的水平投影中的连续不为0的投影区域,投影区域的个数即为文本换行的个数,每个投影区域的上边界即为建立基线的起始位置;
步骤4,建立基线;
从基线起始位置开始到图像末尾结束,自左向右每隔5个像素点,选取一个像素点作为追踪点;选择上一个追踪点右方水平第5个像素点及上一个追踪点右方水平第5个像素点的上下各两个点为下一个追踪点的候选点,分别将水平点命名为P,上方两个点U1、U2,下方两个点D1、D2;根据以下规则从上至下依次判断计算出下一个追踪点:
1). 若P、U1、U2、D1、D2的像素值相同,选取P为下一个追踪点;
2). 否则,若P为背景点,且D1或D2为前景点,选取D1为下一个追踪点;
3). 否则,若P为前景点,且U1或U2为背景点,选取U1为下一个追踪点;
4). 其他,选取P为下一个追踪点;
基线由追踪点自左向右相连得出;
步骤5,确定粘连区域的位置;
基于步骤4中建立的基线,将原始图像切分成多个文本行条;然后,每隔90~120像素,将文本行条切分成图像块,保证每个图像块位于上下两条基线之间;分析图像块中的连通区域的高度,若图像块中存在大于其高度的9/10的连通区域,则认为该图像块为粘连图像块,需要进一步处理;否则将和下基线相连的连通区域标记为下一行,其余的标记为本行;
步骤6,切分粘连区域;
将步骤5中得到的粘连块进行距离变换处理,并对处理后的图像进行水平投影;从投影中找到最小值对应的行作为切分行所在的位置,将切分行下方的前景区域标记为下一行,其余区域标记为本行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710849135.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于医院的数据信息交换方法
- 下一篇:一种半自动外周血管检测操作系统





