[发明专利]一种基于稀疏编码特征的场景文本识别方法有效

专利信息
申请号: 201410184072.6 申请日: 2014-05-04
公开(公告)号: CN103942550B 公开(公告)日: 2018-11-02
发明(设计)人: 王菡子;王大寒;章冬 申请(专利权)人: 厦门大学
主分类号: G06K9/20 分类号: G06K9/20;G06K9/46
代理公司: 厦门南强之路专利事务所(普通合伙) 35200 代理人: 马应森
地址: 361005 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 稀疏 编码 特征 场景 文本 识别 方法
【说明书】:

一种基于稀疏编码特征的场景文本识别方法,涉及计算机视觉和模式识别。输入待识别的自然场景文本图像;采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;将检测到的字符合并成一个词或文本行;输出场景文本识别结果。能够更加有效地表示和提取字符的结构特征,从而提高场景文本的识别率。

技术领域

本发明涉及计算机视觉和模式识别,尤其是涉及一种基于稀疏编码特征的场景文本识别方法。

背景技术

随着智能手机和数码相机等产品越来越流行,获取图片和视频已经变得轻而易举,图像和视频的分析和理解成为具有广阔应用前景的研究方向之一。在图像和视频中,文本信息包含了重要的语义信息,对图像和视频的理解有重要价值,比如书本的封页、道路旁的广告牌、路标信息、视频中的字幕等都包含了大量信息,这些信息更加便于人类和计算机理解和存储。所以在计算机视觉领域,场景图像文本识别吸引了越来越多的关注。由于场景图像背景复杂,场景文字的大小、字体、颜色各异,且易受光照变化和图像退化的影响,这使场景文本的识别具有较大的挑战性。

传统的OCR(光学字符识别)技术能很好的识别背景比较简单的扫描文本文档,但是用来识别场景文本上时,识别率非常低。场景文本与扫描的文本文档不同,在场景文本中,由于背景比较复杂,在识别文本时必须要先检测到文本区域后才能进行识别。而在文本文档中,进行简单的二值化处理就能得到清晰的文本区域,采用OCR进行识别就能得到比较好的效果。所以场景文本的识别不仅仅要识别文本,还包含了对文本的检测。

当前对场景文本的识别主要采用计算机视觉中的目标检测的思想,同时进行文本检测和识别。其基本思想是,把每一类字符当作一个视觉目标,然后再从场景文本图像中检测字符区域,同时也给出了候选字符区域的识别类别和识别分数。在字符检测和识别的基础上,再将候选字符区域和相应的字符类别连接起来,得到场景文本的识别结果。这种同时进行检测和识别的方法在国际顶级会议ICCV2011提出来,表现出了优于传统OCR的识别性能。之后的几年有很多研究也进行了这方面的研究,提高了场景文本识别的性能。但是,在这些基于目标检测的场景文本识别方法中,字符分类器(由于字符检测和识别用的是同一个分类器,下面统一用字符分类器)采用的是目标检测中常用的梯度方向直方图特征(即HOG,Histogram of Gradients)。HOG特征能较好的表达目标的局部表观特征和形状特征,且对光照不敏感,所以HOG特征广泛应用于人脸检测、行人检测等计算机视觉任务中。在当前提出的场景文本识别算法中,HOG特征提取方法也被用来作为字符分类器的特征提取算法。

虽然HOG特征能表示局部特征(比如边缘等),但是HOG特征不能有效表达结构信息。尤其是对字符识别,字符的结构信息是非常重要的信息,能够有效区分字符之间的结构差异,从而提高字符识别率。基于稀疏编码特征的场景文本识别方法,还没有相关专利或文献的报道。

发明内容

本发明的目的在于针对当前场景文本识别中字符分类器的特征提取不能有效表达字符结构信息等问题,提供一种基于稀疏编码特征的场景文本识别方法。

本发明包括如下步骤:

步骤S1:输入待识别的自然场景文本图像;

步骤S2:采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410184072.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top