[发明专利]一种结合最大极值稳定区域和笔画宽度变化的文本定位方法在审

专利信息
申请号: 201711310281.0 申请日: 2017-12-11
公开(公告)号: CN108038481A 公开(公告)日: 2018-05-15
发明(设计)人: 张再跃;潘立;刘亮亮;刘嘎琼;武子毅 申请(专利权)人: 江苏科技大学;江苏科技大学海洋装备研究院
主分类号: G06K9/20 分类号: G06K9/20;G06K9/40;G06K9/44;G06K9/46
代理公司: 北京一格知识产权代理事务所(普通合伙) 11316 代理人: 滑春生
地址: 212003*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 结合 最大 极值 稳定 区域 笔画 宽度 变化 文本 定位 方法
【说明书】:

发明涉及一种结合最大极值稳定区域和笔画宽度变化的文本方法,使用MSER对图像进行文本检测;然后对图像进行边缘化处理;并沿边缘像素点的梯度方向计算笔画宽度值;使用形态学操作去除噪点、填充间隙并计算获得连通域;最后根据规则过滤非文本域并合并连通域。本发明的优点在于:本发明通过MSER检测获取粗糙文本域,结合边缘化处理、笔画宽度变化特征及形态学操作,实现了在自然场景图像中进行文本定位,经实验证明,本发明准确率高,有利于之后文本分割和文本识别工作,在自然场景文本定位领域中具有十分明显的实用意义,可广泛推广使用。

技术领域

本发明涉及人工智能计算机领域中的图像处理,特别涉及一种利用图像处理来实现自然场景中的文本定位方法。

背景技术

在进行自然场景文本定位的过程中,有一个基本的而且不可避免的问题:对有着复杂自然背景的图像来说,如何避免文本布局、字体类型、光照强度及拍摄角度等因素影响,准确获取文本位置。

文本定位在文本检测过程中是至关重要的,文本定位效果的好坏直接决定了之后文本分割以及文本识别的准确度。文本定位在自然场景中的应用越来越广泛,然而复杂的自然场景环境给这项技术带来了许多挑战。不同于传统的文本定位技术,自然场景中有着大量的干扰物,同时拍摄角度及字体等因素会使文本发生形变,使文本定位更加困难。因此,需要寻找文本特征,使文本定位过程不受这些因素的影响。

自然场景中文本定位的方法有很多,主要分为滑动窗口方法和连通域分析方法两类。滑动窗口方法利用一个移动的窗口对图像的所有位置进行文本检测,连通域分析方法通过选取图像特征来获取候选连通域,筛选合并后实现文本定位。

在自然场景文本定位中,常遇到几个难题需要解决:

1)文本特征提取是一个自然场景中文本定位的步骤,因此在提取文本特征前需要进行图像预处理,然后提取图像中所需的文本特征,并根据所提取的特征生成候选连通域。

2)如何来区分文本域和非文本域,自然场景中存在这大量与文本具有十分类似特征的干扰物,如植物、路标、栏杆等。因此在获得候选连通域以后,需要区分其中的非文本域并滤除。

3)自然场景中的文本形式多种多样,包含了不同的字体以及语言。因此如何使定位方法能够兼容各种语言及字体是需要解决的问题。

因此想要实现在自然场景中进行文本定位并获得较高的准确率,需要考虑如下有待解决的问题:

技术问题1:自然场景图像预处理后文本特征的提取。如何选择要提取的文本特征,使得定位方法可以有效的克服自然场景干扰因素以及多字体兼容问题;

技术问题2:候选连通域过滤问题。如何设计规则来生成候选连通域并过滤区分非文本域;

技术问题3:单字连通域合并问题。如何筛选单字连通域并合并成文本域;

针对上述难题和问题,本发明提出并且实现了结合最大极值稳定区域和笔画宽度变化特征的自然场景文本定位方法。

发明内容

本发明要解决的技术问题是提供一种结合最大极值稳定区域和笔画宽度变化的文本定位方法,以实现在自然场景图像中实现准确的文本定位。

为解决上述技术问题,本发明的技术方案为:一种结合最大极值稳定区域和笔画宽度变化的文本定位方法,其创新点在于:所述文本定位方法包括如下步骤:

(1)利用MSER进行对文本域进行检测:对原始图像进行灰度化,并用0-255的整数来表示图像中各像素点的灰度值;在图像灰度值范围内任取一阈值,灰度值小于阈值的像素点定义为黑色,大于阈值的像素点为白色,当阈值为0时,整个图像为白色,在阈值从0到255变化过程中,黑色区域稳定不变且区域梯度最小,则该区域为最大稳定极值区域;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏科技大学;江苏科技大学海洋装备研究院,未经江苏科技大学;江苏科技大学海洋装备研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711310281.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top