[发明专利]一种基于图像变换的环形文本检测和识别方法在审
| 申请号: | 202010866455.7 | 申请日: | 2020-08-25 |
| 公开(公告)号: | CN111986220A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 高飞;葛逸凡;卢书芳;翁立波;张元鸣 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T7/11;G06N3/08;G06K9/34;G06K9/32;G06T7/66;G06T7/90 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 周红芳;朱盈盈 |
| 地址: | 310014 *** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图像 变换 环形 文本 检测 识别 方法 | ||
本发明公开了一种基于图像变换的环形文本检测和识别方法,首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果。相比于现有的环形文本检测和识别技术,本发明所提出的方法时间消耗短、识别准确率高并且不会因为图像变换而丢失原有的语义信息。
技术领域
本发明涉及图像处理和场景文字检测识别技术领域,具体为一种基于图像变换的环形文本检测和识别方法。
背景技术
文本作为图像中的高层语义信息,能够帮助人们更好地理解图像。将图像中的文本通过计算机技术识别出,是实现人工智能技术的基础。相比于光学字符识别(OCR技术),自然场景下的文字识别具有更高的难度。而在自然场景文字识别领域中,相比于水平或竖直文本的识别,曲线文本甚至是环形文本的识别挑战性更大。因此,提出一种能够高效、精准的环形文本检测和识别方法具有重要的意义。
针对环形文本的检测和识别,国内外专家和学者展开了重点研究。其中与本发明较为接近的包括:。发明专利(发明人:李辉;朱文康;申胜男;方启航;谭震彪,申请号:CN201910920945.8,名称:环形文字快速识别方法及装置)通过深度神经网络YOLO算法检测图像中的环形区域,通过坐标转换方法将环形文字带转换为矩形文字带,通过深度神经网络YOLO算法定位转换后图像中的文字区域,将定位到的文字区域进行分割和校正,得到各个字符图像,将每个分割好的字符图像进行神经网络的字符识别,得出文字的识别结果。
在现有环形文本检测方法中,存在如下不足:1)以上方法所提到的采用深度神经网络YOLO算法来检测图像中的环形区域,该方法对运行设备资源占用率大、时间消耗长;2)通过基于坐标转换方法转换后的图像在边缘处平滑度不高,容易丢失细节信息;3)在图像转换之前未检测文本在环形区域中的位置,直接转换图像可能会导致因为对单个文字的切分或对某段文字的切分而造成的语义信息丢失的问题。
发明内容
为解决现有方法的不足,本发明提出一种基于图像变换的针对环形文本检测和识别方法;首先通过一种基于霍夫圆检测算法的自适应阈值的圆环检测方法来检测图像中文本所在的圆环区域,接着使用所提出的文字边缘检测算法确定文字之间的扇形空隙区域,采用TPS插值算法将环形文本沿空隙最大处展开,得到包含举行文本区域的图像,最后采用基于深度神经网络的文字识别模型输出文字识别结果,用于解决现有环形文本检测和识别技术中效率低、精度差、容易丢失语义信息等问题。
本发明的技术方案如下:
一种基于图像变换的环形文本检测和识别方法,其特征在于,包括如下步骤:
步骤1:检测文本所在的环形区域,具体为:
步骤1.1:对包含环形文本区域的图像I采用霍夫圆检测算法,检测阈值设为λ,检测后的结果记为集合L={lk|k=1,2,…,K},其中,lk表示检测到的第k个圆,K表示检测到的圆的数量;令lk的圆心坐标为(xlk,ylk);
步骤1.2:选取L中半径最大的圆,记为R1,令R1的圆心坐标为(xl0,yl0);
步骤1.3:增大检测阈值,令λ=λ+λ0,以增大后的λ为检测阈值对I采用霍夫圆检测算法,将检测到的圆加入集合L中,λ0表示增量常数;
步骤1.4:重复步骤1.3,直到I中不再检测到圆;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010866455.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





