[发明专利]一种基于图像变换的环形文本检测和识别方法在审

申请号：	202010866455.7	申请日：	2020-08-25
公开（公告）号：	CN111986220A	公开（公告）日：	2020-11-24
发明（设计）人：	高飞;葛逸凡;卢书芳;翁立波;张元鸣	申请（专利权）人：	浙江工业大学
主分类号：	G06T7/13	分类号：	G06T7/13;G06T7/11;G06N3/08;G06K9/34;G06K9/32;G06T7/66;G06T7/90
代理公司：	杭州浙科专利事务所(普通合伙) 33213	代理人：	周红芳;朱盈盈
地址：	310014 ***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于图像变换环形文本检测识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于图像变换的环形文本检测和识别方法，其特征在于，包括：

步骤1：检测文本所在的环形区域，具体为：

步骤1.1：对包含环形文本区域的图像I采用霍夫圆检测算法，检测阈值设为λ，检测后的结果记为集合L＝{l_k|k＝1,2,…,K}，其中，l_k表示检测到的第k个圆，K表示检测到的圆的数量；令l_k的圆心坐标为(xl_k,yl_k)；

步骤1.2：选取L中半径最大的圆，记为R₁，令R₁的圆心坐标为(xl₀,yl₀)；

步骤1.3：增大检测阈值，令λ＝λ+λ₀，以增大后的λ为检测阈值对I采用霍夫圆检测算法，将检测到的圆加入集合L中，λ₀表示增量常数；

步骤1.4：重复步骤1.3，直到I中不再检测到圆；

步骤1.5：根据公式(1)计算L中每个圆的圆心(xl_k,yl_k)与(xl₀,yl₀)的距离d_k，当d_kδ时，将l_k加入集合L′＝{l′_k|k＝1,2,…,K′}中，其中，K′表示满足条件的圆的数量，δ表示距离阈值常数；

步骤1.6：选取L′中除了R₁之外半径最大的圆，记为R₂；最终R₁与R₂所组成的圆环形区域为文本实际所在的环形区域；

步骤2：确定文字起始和终止处之间的扇形空隙区域，具体步骤为：

步骤2.1：采用canny边缘算子对I处理，得到的二值化图像记为I′，根据公式(2)和(3)设置I′中的像素点(x_i,y_j)的灰度值；

其中，pv_ij表示图像中像素点(x_i,y_j)的灰度值，R和r分别表示R₁和R₂的半径长度，d_ij表示I′中的像素点(x_i,y_j)到R₁的圆心的距离；

步骤2.2：在图像I′中从(xl₀,yl₀)出发水平向右引一条射线，记为sl₁；若sl₁上存在灰度值为0的像素点，则将sl₁围绕(xl₀,yl₀)逆时针旋转，直到sl₁上每个像素点的灰度值均为255；

步骤2.3：生成一条与sl₁重合的射线，记为sl′₁；将sl′₁围绕(xl₀,yl₀)逆时针旋转，直到sl′₁上存在灰度值为0的像素点；sl₁与sl′₁之间的区域为不包含边缘信息的扇形空隙区域，记为(θ₁,Δθ₁)，其中θ₁表示sl₁旋转经过的角度，Δθ₁表示sl′₁旋转经过的角度，设置该区域上全部像素点的灰度值为0；

步骤2.4：重复步骤2.2和步骤2.3，其中第q次重复生成的射线分别记为sl_q和sl′_q，直到sl_q旋转经过的角度θ_q＞360°；定义集合SL＝{(θ_q,Δθ_q)|q＝1,2,…,K_SL}，其中，Δθ_q表示sl′_q旋转经过的角度，K_SL表示检测到的文本区域个数；根据公式(4)得到文字起始和终止处之间的扇形空隙区域(θ′,Δθ′)；其中

步骤3：生成TPS插值算法所需要的控制点集，具体步骤为：

步骤3.1：生成在图像I中的控制点集：在图像I中以(x₀,y₀)为极点、从(x₀,y₀)出发水平向右引一条射线作为极轴构建极坐标系，在该极坐标系中将R₁上的点集记为T＝{t_i＝(R,θ′+Δθ′+θ_i)|i＝1,2,…,N}，将R₂上的点集记为B＝{b_i＝(r,θ′+Δθ′+θ_i)|i＝1,2,…,N}；其中t_i和b_i分别表示在R₁和R₂上的点，θ_i可以根据公式(5)计算得到，N表示集合T和B中点的数目；

其中，Δθ′表示文字起始和终止处之间的扇形空隙区域对应的夹角；

步骤3.3：将待生成的目标图像记为I″，构造生成I″的控制点集：构建分布在I″上沿的点集T′＝{t′_i＝((i-1)×d,0)|i＝1,2,...,N}；构建分布在I″下沿的点集B′＝{b′_i＝((i-1)×d,H)|i＝1,2,...,N}，其中，点间距d和图像I″的高度H根据公式(6)计算得到；

步骤4：定义集合TB＝{{(t_i,t′_i),(b_i,b′_i)}|i＝1,2,...,N}，其中(t_i,t′_i)表示t_i和t′_i组成的控制点对，(b_i,b′_i)表示b_i和b′组成的控制点对；将TB中的控制点对代入TPS样条插值函数实现图像I到图像I″的转换；转换后的图像I″为平直的矩形图像，在I″中的内容为被拉直后水平排列的文字；

步骤5：定义排列于同一文本行且分布靠近的一组字符被称为同一组合字符簇；通过深度神经网络对图像I″进行检测，得到的结果记为S＝{s_i|i＝1,2,…,M}，其中，s_i表示第i个组合字符簇所在的最小外接矩形，M表示I″中检测到的组合字符簇的数量；

步骤6：将s_i包围的图像输入至深度神经网络文字识别模型中，输出s_i对应的文本的识别结果；最终按照s_i在I″中的排列分布，输出全部文本的识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工业大学，未经浙江工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010866455.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种高强度混凝土浇筑楼板及其施工方法
下一篇：一种提取车辆轨迹特征运动模式的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图像变换的环形文本检测和识别方法在审

专利文献下载