[发明专利]基于Harris角点和笔画宽度的文字区域检测方法有效

专利信息
申请号: 201510407779.3 申请日: 2015-07-13
公开(公告)号: CN105205488B 公开(公告)日: 2018-07-24
发明(设计)人: 蒋晓悦;连洁;冯晓毅;李会方;吴俊;谢红梅;何贵青;夏召强 申请(专利权)人: 西北工业大学
主分类号: G06K9/46 分类号: G06K9/46
代理公司: 西北工业大学专利中心 61204 代理人: 顾潮琪
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 harris 笔画 宽度 文字 区域 检测 方法
【说明书】:

发明提供了一种基于Harris角点和笔画宽度的文字区域检测方法,该方法主要包括边缘增强的Harris角点检测,依据笔画宽度筛选候选区域以及基于文字颜色的区域膨胀三大部分,本发明通过对角点检测得到的文字区域后进行连通区域分析,去掉不符合文字行特征的响应区域,可显著提高角点检测图像中文字区域的准确率,较单一基于边缘特征的文字检测方法,可提高图像中的文字检测的召回率,较单一基于连通区域的文字检测方法,可获得更高的检测效率,本发明较单一的基于边缘特征和基于连通区域的文字检测方法都具有优势。

技术领域

本发明涉及一种图像处理,尤其是文字区域检测方法。

背景技术

根据2012年的互联网统计数据,该年接入互联网的各类电子设备达到了170亿,仅每天上传到facebook的图像就达到了3亿张。面对互联网上海量的图像、视频资源,如何对它们做到正确、高效的理解成为当前多媒体信息技术研究的重点。与图像的颜色、灰度等低级信息相比,图像中的文字信息与图像内容紧密相关,是可以被人直接理解和利用的高级语义信息,因此对图像中的文字获取成为了理解图像、视频内容的重要线索。现有的复杂背景下文字检测的方法主要可以分为三大类,分别是基于边缘特征的方法、基于连通区域的方法和基于纹理的方法。基于边缘特征的算法思路简明,检测速度很快,但是检测后会出现大量的虚警区。基于连通区域检测文字的方法可以减少误判的几率,但是对整幅图像进行颜色连通区域分析,效率非常低,并且对于文字相较背景对比度过小或是两者颜色接近时,检测效果不理想。而基于纹理的文字检测方法当背景复杂时,稳定性较差,并且耗时较长。考虑到基于单一像素和连通区域两种检测方案的优缺点及适用范围,我们提出综合使用上述两种方法,保证我们的文字检测方法既有基于边缘特征算法的高效性,同时还有基于连通区域检测的准确性。

因此,本发明的目的是针对基于边缘特征提取到的文字虚警过多,以及基于连通区域检测文字效率低下,不利于对大量图像数据进行文字区域的快速准确定位的问题,提出一种新的基于边缘特征和联通区域特征的文字检测方法。本方法首先对整幅图像进行边缘特征提取,然后在边缘特征响应区域内进行连通区域检测,去除非文本区域,最后,在保留下的区域内,根据局部文字颜色一致的特征扩张原有区域得到完整的文字行,在提高检测准确率的同时显著提高检测效率。

发明内容

为了克服现有技术的不足,针对图像中的文字区域,我们利用文字区域丰富的边缘信息,尤其是中文文字具有丰富的角点信息,首先对整幅图像进行Harris角点检测。然后在角点响应区域内进行笔画宽度的计算,去除非文本区域,最后,在保留下的区域内,根据局部文字颜色一致的特征扩张原有区域得到完整的文字行,最终提高文字检测的准确性以及效率。

本发明解决其技术问题所采用的技术方案是基于Harris角点和笔画宽度的文字区域检测方法,该方法主要包括边缘增强的Harris角点检测,依据笔画宽度筛选候选区域以及基于文字颜色的区域膨胀三大部分,具体步骤如下:

步骤1:边缘增强的Harris角点检测

假设原灰度图像为I,

(1.1)用canny算子对原灰度图像I进行边缘检测得到边缘图像Iedge,之后按下式计算得到图像I':

I'=I+nedge*Iedge (1)

其中nedge为边缘图像Iedge的放大倍数,取值范围为80~120,然后代入下式:

I”(i,j)=I'(i,j)/I'MAX*256 (2)

其中I'(i,j)为图像I'中点(i,j)处的像素值,I'MAX为图像I'中所有像素点的最大值,式(2)可确保更新后的图像I”中各像素点的取值范围在[0,255]之间;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510407779.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top