[发明专利]一种基于图像变换的环形文本检测和识别方法在审

专利信息
申请号: 202010866455.7 申请日: 2020-08-25
公开(公告)号: CN111986220A 公开(公告)日: 2020-11-24
发明(设计)人: 高飞;葛逸凡;卢书芳;翁立波;张元鸣 申请(专利权)人: 浙江工业大学
主分类号: G06T7/13 分类号: G06T7/13;G06T7/11;G06N3/08;G06K9/34;G06K9/32;G06T7/66;G06T7/90
代理公司: 杭州浙科专利事务所(普通合伙) 33213 代理人: 周红芳;朱盈盈
地址: 310014 *** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图像 变换 环形 文本 检测 识别 方法
【权利要求书】:

1.一种基于图像变换的环形文本检测和识别方法,其特征在于,包括:

步骤1:检测文本所在的环形区域,具体为:

步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);

步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);

步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;

步骤1.4:重复步骤1.3,直到I中不再检测到圆;

步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dkδ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示满足条件的圆的数量,δ表示距离阈值常数;

步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;

步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:

步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;

其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;

步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0的像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;

步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;

步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);其中

步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:

步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目;

其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;

步骤3.3:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;

步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;

步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;

步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010866455.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top