[发明专利]一种基于层级轮廓提取的象形文字分割方法在审
申请号: | 202110016231.1 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112686265A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 庄建军;黎文斯;申彤;刘荪荟;李旭坤;汪继康;张志俭;葛中芹;张鑫;杨继琼 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/32;G06K9/40;G06K9/46 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层级 轮廓 提取 象形文字 分割 方法 | ||
本发明公开了一种基于层级轮廓提取的象形文字分割方法,首先通过一层高斯滤波器、OTSU二值化和一层双边滤波器对图片预处理,能够有效地去除噪声,并且保留文字边缘信息,可以给后续步骤提供良好的预处理图片;然后通过对轮廓包含的矩形区域是否含有外围矩形的判断,将提取出的轮廓分层,从而抑制文字内部轮廓的输出;接着通过计算轮廓所包含的矩形区域面积大小来设定阈值,只有大于阈值的矩形才包含待输出的文字,以此来抑制噪声点的输出;最后通过坐标排序的方式来顺序输出分割的文字;本方法最终可以在各种角度和不同光线下高效准确地分割出象形文字经书上的文字,具有良好的泛化性和鲁棒性。
技术领域
本发明涉及文字分割技术领域,主要涉及一种基于层级轮廓提取的象形文字分割方法。
背景技术
东巴古籍由具有独特图形及发音的东巴象形文写成,是当今世界上唯一还在使用的象形文字,东巴文化保护迫在眉睫。
近年来,譬如OCR等文字分割技术相对成熟,但这些技术大多针对标准印刷文字,但对于东巴这种象形文字并没有好的解决方案,并且在经书这种复杂场景下的分割任务是更加困难的。
发明内容
发明目的:本发明针对上述背景技术中存在的问题,本发明提供了一种基于层级轮廓提取的象形文字分割方法,采用高斯滤波、OSTU自适应阈值法进行二值化处理、双边滤波对图片进行预处理,然后基于层级轮廓提取获得象形文字轮廓,最后按照文字阅读顺序进行输出排列。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于层级轮廓提取的象形文字分割方法,其特征在于,包括以下步骤:
步骤S1、图片预处理;
步骤S1.1、获取原始图片,读取原图片的灰度图,将灰度图输入至高斯滤波器进行滤波处理;
步骤S1.2、采用OTSU自适应阈值法对所述步骤S1.1获取的图像进行二值化处理;
步骤S1.3、将所述二值化处理后的图像输入至双边滤波器,完成图片预处理;
步骤S2、层级轮廓提取;
步骤S2.1、扫描图片中的每一个像素点,以像素点为中心,判断周围是否存在其他像素点;当存在其他像素点时,将当前像素点标记为已探索点,并以新探测的像素点为中心重复探索,直至整个轮廓都标记为已探索点;将所有已探索点中坐标值(x,y)最大值点和最小值点作为对角点,连接形成矩形区域取出,完成轮廓检测,并将该矩形区域保存到待输出集合中;
步骤S2.2、对于待输出集合中的轮廓,当矩形区域外围没有更大的矩形区域时,则将该轮廓作为第一层级轮廓,否则作为第二层级轮廓;舍弃所有第二层轮廓,只保留第一层轮廓;
步骤S2.3、计算每个第一层轮廓的矩形区域面积,选取阈值res=0.015*(h*w),其中h为原始图像的高、w为原始图像的宽;当矩形区域面积大于阈值res时,保留该轮廓并输出,当矩形区域面积小于等于阈值res时,舍弃该轮廓;
步骤S3、将步骤S2输出的矩形轮廓按照象形文字阅读顺序依次输出。
进一步地,所述步骤S1.1中高斯滤波器函数如下:
其中所述高斯滤波器核为3*3;(x、y)代表相对于核中心周围8个像素点的相对坐标,σ代表高斯核函数在x与y方向的标准偏差,取值为0.95。
进一步地,所述步骤S1.2中将大于阈值的像素点设置为255,小于阈值的设置为0。
进一步地,所述步骤S1.3中双边滤波器如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110016231.1/2.html,转载请声明来源钻瓜专利网。