[发明专利]一种结合最大极值稳定区域和笔画宽度变化的文本定位方法在审
申请号: | 201711310281.0 | 申请日: | 2017-12-11 |
公开(公告)号: | CN108038481A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 张再跃;潘立;刘亮亮;刘嘎琼;武子毅 | 申请(专利权)人: | 江苏科技大学;江苏科技大学海洋装备研究院 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/40;G06K9/44;G06K9/46 |
代理公司: | 北京一格知识产权代理事务所(普通合伙) 11316 | 代理人: | 滑春生 |
地址: | 212003*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 最大 极值 稳定 区域 笔画 宽度 变化 文本 定位 方法 | ||
1.一种结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述文本定位方法包括如下步骤:
(1)利用MSER进行对文本域进行检测:对原始图像进行灰度化,并用0-255的整数来表示图像中各像素点的灰度值;在图像灰度值范围内任取一阈值,灰度值小于阈值的像素点定义为黑色,大于阈值的像素点为白色,当阈值为0时,整个图像为白色,在阈值从0到255变化过程中,黑色区域稳定不变且区域梯度最小,则该区域为最大稳定极值区域;
(2)Canny算子边缘化处理图像:利用高斯滤波器平滑图像,对滤波后的图像计算其梯度幅度和梯度方向,对梯度幅度进行非极大值抑制,找出图像梯度中的局部极大值点,并将非局部最大值点置零,以此细化图像边缘,用双阈值算法检测和连接边缘;
(3)获取图像笔画宽度特征:对每一个边缘像素点,在垂直于边缘的梯度方向上定义一条射线,沿射线方向寻找对应的另一边缘像素点,在梯度方向上找到另一边缘像素点,且该点的梯度方向与原梯度方向近似相反,则这两个边缘像素点的距离被认为是笔画宽度;未找到对应像素点或对应像素点梯度方向不近似相反,则丢弃该射线,在更为复杂的笔画环境中,沿未舍弃的射线计算所有像素点的笔画宽度中值m,并将射线上所有笔画宽度值大于m的像素点笔画宽度中值都设为m;
(4)形态学运算处理图像:对图像使用开、闭运算,开运算先对图像进行腐蚀操作,去除图像的边缘毛刺,然后进行膨胀操作,填充图像细小缝隙和小孔,闭运算先进行膨胀操作,填补图像的断裂区域,轮廓缺口,然后进行腐蚀操作,平滑图像边缘;
(5)候选文本域生成:将文本像素点根据规则聚集成候选文本域,相邻像素点笔画宽度值在阈值范围内则归为同一连通域,计算连通域的宽高比及面积比,将超过阈值范围的连通域作为非文本域滤除;
(6)文本域合并:对单字文本域作进一步过滤,相邻单字文本域内笔画宽度均值比、高度比、及像素点颜色均值比超过阈值,将偏差较大的连通域作为噪声滤除,将剩余连通域聚集成连,形成连续文本域。
2.根据权利要求1所述的结合最大极值稳定区域和笔画宽度变化的文本定位方法,其特征在于:所述利用MSER进行对文本域进行检测的步骤中,最大稳定极值区域是一种依赖于区域内部和边界像素关系,根据稳定性判定条件来获取最大稳定极值区域的算法;对于输入图像进行灰度化,在0-255的图像灰度值范围内任取一阈值,Q1,….,Qi,…是一系列嵌套极值区域,且
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学;江苏科技大学海洋装备研究院,未经江苏科技大学;江苏科技大学海洋装备研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711310281.0/1.html,转载请声明来源钻瓜专利网。