[发明专利]一种自然场景文字检测的方法有效
申请号: | 201710728404.6 | 申请日: | 2017-08-23 |
公开(公告)号: | CN107480648B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 路通;王文海;牟星;涂庆红 | 申请(专利权)人: | 南京大学;深圳互连科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 卫麟 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自然 场景 文字 检测 方法 | ||
1.一种自然场景文字检测的方法,其特征在于:包括以下步骤:
步骤1,输入一张待检测文字的图片;
步骤2,提取输入图片的极值区域,并通过极值区域的面积、周长、欧拉数和像素值方差来过滤掉多余的极值区域,得到字符候选区域;
步骤3,提取每个字符候选区域的边缘图像,并计算边缘图像的COLD特征;
步骤4,将字符候选区域的COLD特征输入预先训练好的随机森林分类器,判断该字符候选区域是不是真正的字符区域;
步骤5,将字符区域合并,得到最终的文字区域,完成自然场景文字检测任务;
所述步骤3包括:
步骤31,通过Canny边缘检测算法对步骤2得到的字符候选区域进行边缘检测,得到边缘图像Icanny;
步骤32,在边缘图像Icanny中找出所有轮廓C;对于任意轮廓c∈C,通过道格拉斯-普克算法对轮廓c进行拟合,拟合后得到的折线上的点集即为轮廓c的关键点集P;
步骤33,利用关键点集P计算COLD特征;其中COLD特征需要分两部分计算,分别为基于点的位置和基于点的方向的COLD特征;
基于点的位置的COLD特征的计算步骤如下:
(1)取步长l,对于任意点pi∈P,计算线段(pi,pi+l)的长度和它与水平线的夹角
其中点pi表示为坐标形式(xi,yi),和的计算公式如下:
(2)把映射到一个二维矩阵上,用表示,其中对应矩阵的行,对应矩阵的列;统计落在每个上点的个数并归一化,得到基于点的位置的COLD特征;其中和的计算公式如下:
其中ln为自然对数函数,表示向下取整操作;
基于点的方向的COLD特征的计算步骤如下:
(1)对于任意点pi∈P,取pi及其前后n个点,即pi-n,pi-n+1,pi-n+2,…,pi+n总共2n+1个点,通过主成分分析算法计算这2n+1个点的总体方向gi,方向gi可以表示为向量形式(gxi,gyi);
(2)取步长l,对于任意方向gi,计算向量差gi-gi+l的大小和它与水平线的夹角和的计算公式如下:
(3)把映射到一个二维矩阵上,用表示,其中对应矩阵的行,对应矩阵的列;统计落在每个上点的个数并归一化,得到基于点的方向的COLD特征;其中和的计算公式如下:
其中ln为自然对数函数,表示向下取整操作;
步骤34,取步长l=1,2,3,…,m,分别计算这m种步长对应的基于点的位置的COLD特征和基于点的方向的COLD特征,得到2m个7×12的二维矩阵;把这2m个矩阵转化为一维数组然后拼接起来,得到大小为2m×7×12=168m的数组,作为最终的COLD特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;深圳互连科技有限公司,未经南京大学;深圳互连科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710728404.6/1.html,转载请声明来源钻瓜专利网。