[发明专利]一种自然场景文字检测的方法有效

专利信息
申请号: 201710728404.6 申请日: 2017-08-23
公开(公告)号: CN107480648B 公开(公告)日: 2020-03-27
发明(设计)人: 路通;王文海;牟星;涂庆红 申请(专利权)人: 南京大学;深圳互连科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/34;G06K9/62
代理公司: 北京德崇智捷知识产权代理有限公司 11467 代理人: 卫麟
地址: 210000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自然 场景 文字 检测 方法
【权利要求书】:

1.一种自然场景文字检测的方法,其特征在于:包括以下步骤:

步骤1,输入一张待检测文字的图片;

步骤2,提取输入图片的极值区域,并通过极值区域的面积、周长、欧拉数和像素值方差来过滤掉多余的极值区域,得到字符候选区域;

步骤3,提取每个字符候选区域的边缘图像,并计算边缘图像的COLD特征;

步骤4,将字符候选区域的COLD特征输入预先训练好的随机森林分类器,判断该字符候选区域是不是真正的字符区域;

步骤5,将字符区域合并,得到最终的文字区域,完成自然场景文字检测任务;

所述步骤3包括:

步骤31,通过Canny边缘检测算法对步骤2得到的字符候选区域进行边缘检测,得到边缘图像Icanny

步骤32,在边缘图像Icanny中找出所有轮廓C;对于任意轮廓c∈C,通过道格拉斯-普克算法对轮廓c进行拟合,拟合后得到的折线上的点集即为轮廓c的关键点集P;

步骤33,利用关键点集P计算COLD特征;其中COLD特征需要分两部分计算,分别为基于点的位置和基于点的方向的COLD特征;

基于点的位置的COLD特征的计算步骤如下:

(1)取步长l,对于任意点pi∈P,计算线段(pi,pi+l)的长度和它与水平线的夹角

其中点pi表示为坐标形式(xi,yi),和的计算公式如下:

(2)把映射到一个二维矩阵上,用表示,其中对应矩阵的行,对应矩阵的列;统计落在每个上点的个数并归一化,得到基于点的位置的COLD特征;其中和的计算公式如下:

其中ln为自然对数函数,表示向下取整操作;

基于点的方向的COLD特征的计算步骤如下:

(1)对于任意点pi∈P,取pi及其前后n个点,即pi-n,pi-n+1,pi-n+2,…,pi+n总共2n+1个点,通过主成分分析算法计算这2n+1个点的总体方向gi,方向gi可以表示为向量形式(gxi,gyi);

(2)取步长l,对于任意方向gi,计算向量差gi-gi+l的大小和它与水平线的夹角和的计算公式如下:

(3)把映射到一个二维矩阵上,用表示,其中对应矩阵的行,对应矩阵的列;统计落在每个上点的个数并归一化,得到基于点的方向的COLD特征;其中和的计算公式如下:

其中ln为自然对数函数,表示向下取整操作;

步骤34,取步长l=1,2,3,…,m,分别计算这m种步长对应的基于点的位置的COLD特征和基于点的方向的COLD特征,得到2m个7×12的二维矩阵;把这2m个矩阵转化为一维数组然后拼接起来,得到大小为2m×7×12=168m的数组,作为最终的COLD特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;深圳互连科技有限公司,未经南京大学;深圳互连科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710728404.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top