[发明专利]一种基于图像变换的环形文本检测和识别方法在审
| 申请号: | 202010866455.7 | 申请日: | 2020-08-25 |
| 公开(公告)号: | CN111986220A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 高飞;葛逸凡;卢书芳;翁立波;张元鸣 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/11;G06N3/08;G06K9/34;G06K9/32;G06T7/66;G06T7/90 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 周红芳;朱盈盈 |
| 地址: | 310014 *** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图像 变换 环形 文本 检测 识别 方法 | ||
1.一种基于图像变换的环形文本检测和识别方法,其特征在于,包括:
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
步骤1.5:根据公式(1)计算L中每个圆的圆心(xlk,ylk)与(xl0,yl0)的距离dk,当dkδ时,将lk加入集合L′={l′k|k=1,2,…,K′}中,其中,K′表示满足条件的圆的数量,δ表示距离阈值常数;
步骤1.6:选取L′中除了R1之外半径最大的圆,记为R2;最终R1与R2所组成的圆环形区域为文本实际所在的环形区域;
步骤2:确定文字起始和终止处之间的扇形空隙区域,具体步骤为:
步骤2.1:采用canny边缘算子对I处理,得到的二值化图像记为I′,根据公式(2)和(3)设置I′中的像素点(xi,yj)的灰度值;
其中,pvij表示图像中像素点(xi,yj)的灰度值,R和r分别表示R1和R2的半径长度,dij表示I′中的像素点(xi,yj)到R1的圆心的距离;
步骤2.2:在图像I′中从(xl0,yl0)出发水平向右引一条射线,记为sl1;若sl1上存在灰度值为0的像素点,则将sl1围绕(xl0,yl0)逆时针旋转,直到sl1上每个像素点的灰度值均为255;
步骤2.3:生成一条与sl1重合的射线,记为sl′1;将sl′1围绕(xl0,yl0)逆时针旋转,直到sl′1上存在灰度值为0的像素点;sl1与sl′1之间的区域为不包含边缘信息的扇形空隙区域,记为(θ1,Δθ1),其中θ1表示sl1旋转经过的角度,Δθ1表示sl′1旋转经过的角度,设置该区域上全部像素点的灰度值为0;
步骤2.4:重复步骤2.2和步骤2.3,其中第q次重复生成的射线分别记为slq和sl′q,直到slq旋转经过的角度θq>360°;定义集合SL={(θq,Δθq)|q=1,2,…,KSL},其中,Δθq表示sl′q旋转经过的角度,KSL表示检测到的文本区域个数;根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′);其中
步骤3:生成TPS插值算法所需要的控制点集,具体步骤为:
步骤3.1:生成在图像I中的控制点集:在图像I中以(x0,y0)为极点、从(x0,y0)出发水平向右引一条射线作为极轴构建极坐标系,在该极坐标系中将R1上的点集记为T={ti=(R,θ′+Δθ′+θi)|i=1,2,…,N},将R2上的点集记为B={bi=(r,θ′+Δθ′+θi)|i=1,2,…,N};其中ti和bi分别表示在R1和R2上的点,θi可以根据公式(5)计算得到,N表示集合T和B中点的数目;
其中,Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角;
步骤3.3:将待生成的目标图像记为I″,构造生成I″的控制点集:构建分布在I″上沿的点集T′={t′i=((i-1)×d,0)|i=1,2,...,N};构建分布在I″下沿的点集B′={b′i=((i-1)×d,H)|i=1,2,...,N},其中,点间距d和图像I″的高度H根据公式(6)计算得到;
步骤4:定义集合TB={{(ti,t′i),(bi,b′i)}|i=1,2,...,N},其中(ti,t′i)表示ti和t′i组成的控制点对,(bi,b′i)表示bi和b′组成的控制点对;将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换;转换后的图像I″为平直的矩形图像,在I″中的内容为被拉直后水平排列的文字;
步骤5:定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇;通过深度神经网络对图像I″进行检测,得到的结果记为S={si|i=1,2,…,M},其中,si表示第i个组合字符簇所在的最小外接矩形,M表示I″中检测到的组合字符簇的数量;
步骤6:将si包围的图像输入至深度神经网络文字识别模型中,输出si对应的文本的识别结果;最终按照si在I″中的排列分布,输出全部文本的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010866455.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





