[发明专利]文本检测设备、文本信息提取系统及其方法在审

专利信息
申请号: 201210128548.5 申请日: 2012-04-27
公开(公告)号: CN103377379A 公开(公告)日: 2013-10-30
发明(设计)人: 麻文华;姜涌 申请(专利权)人: 佳能株式会社
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 罗银燕
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 检测 设备 信息 提取 系统 及其 方法
【权利要求书】:

1.一种文本检测方法,包括:

子结构生成和过滤步骤,用于从输入图像生成多个子结构,并基于形状特征从所述多个子结构过滤掉非文本子结构以获得候选子结构;

种子子结构选择步骤,用于从所述候选子结构选择种子子结构,所述种子子结构具有所述输入图像中的字符的完整形状;

子结构组生成和过滤步骤,用于通过基于所述候选子结构的空间关系将它们分组在一起来生成子结构组,并基于所述种子子结构的性质对所述子结构组进行过滤;以及

文本区域生成和整合步骤,用于基于所述子结构组生成文本区域,并基于所述文本区域的空间关系对所述文本区域进行整合。

2.如权利要求1所述的方法,其中,所述子结构包括所述字符的连通域或所述字符的边缘。

3.如权利要求1所述的方法,进一步包括:预处理步骤,用于在从所述输入图像生成所述多个子结构之前基于颜色和/或尺度将所述输入图像变换为一套或更多套输入图像。

4.如权利要求3所述的方法,其中,所述预处理步骤进一步包括:

转换步骤,用于将所述输入图像转换成展示亮度信息的灰度通道图像和展示颜色色调信息的S通道图像;以及

缩放步骤,用于分别将所述灰度通道图像和所述S通道图像缩放至数个尺度,以获得所述一套或更多套输入图像,

或者,所述预处理步骤进一步包括:

缩放步骤,用于将所述输入图像缩放至数个尺度;以及

转换步骤,用于将缩放后的图像中的每一个转换成展示亮度信息的灰度通道图像和展示颜色色调信息的S通道图像,以获得所述一套或更多套输入图像。

5.如权利要求4所述的方法,其中,在输入图像的每个像素处通过从其R、G和B通道值中的最大值减去其R、G和B通道值中的最小值来计算所述S通道图像。

6.如权利要求3所述的方法,其中,使所述一套或更多套输入图像中的每一个单独受到所述子结构生成和过滤步骤、所述种子子结构选择步骤、所述子结构组生成和过滤步骤以及所述文本区域生成和整合步骤的处理;以及

其中,在所述文本区域生成和整合步骤中将从所述一套或更多套输入图像生成的文本区域整合在一起。

7.如权利要求1至6中任一项所述的方法,其中,所述种子子结构选择步骤进一步包括:

评估步骤,用于基于预学习的文本模型评估每个候选子结构的文本置信度值;以及

选择步骤,用于基于所述文本置信度值选择所述种子子结构。

8.如权利要求7所述的方法,其中,所述评估步骤进一步包括:

提取步骤,用于从与每个候选子结构的外接框对应的输入图像中的区域提取纹理特征;以及

计算步骤,用于基于所述预学习的文本模型的输出计算所述每个候选子结构的文本置信度值,所述预学习的文本模型被输入有其纹理特征。

9.如权利要求8所述的方法,其中,所述评估步骤进一步包括:

修改步骤,用于减小所述候选子结构中的除文本子结构外的子结构的文本置信度值。

10.如权利要求7所述的方法,其中,基于从一套训练图像获得的候选子结构样本对所述预学习的文本模型进行训练;以及

其中,通过将通过使用与所述子结构生成和过滤步骤相同的处理而从所述一套训练图像提取的候选子结构手工标记为肯定样本和否定样本,来获得所述候选子结构样本。

11.如权利要求1至6中任一项所述的方法,其中,所述子结构组生成和过滤步骤进一步包括:

生成步骤,用于通过将其中心点位于或靠近同一条直线的候选子结构分组在一起来生成所述子结构组;以及

过滤步骤,用于基于所述种子子结构的性质对所述子结构组进行过滤。

12.如权利要求11所述的方法,其中,所述性质包括平均笔划宽度、平均灰度级值和/或尺寸。

13.如权利要求11所述的方法,其中,所述过滤步骤进一步包括:

第一过滤步骤,用于过滤掉在其中不具有种子子结构的子结构组;以及

第三过滤步骤,用于过滤掉其性质与同一子结构组中的种子子结构偏离的非种子子结构。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210128548.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top