[发明专利]弯曲文字识别方法和装置有效
| 申请号: | 201811379524.0 | 申请日: | 2018-11-20 |
| 公开(公告)号: | CN111199224B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 龚靖;沈雷;王铮;杨迪;汪少敏 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | G06V30/19 | 分类号: | G06V30/19;G06N3/0464;G06V10/82;G06V30/146 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 许蓓 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 弯曲 文字 识别 方法 装置 | ||
本公开提出一种弯曲文字识别方法和装置,涉及文字识别领域。获取待检测图像中的文字框以及各个文字框对应的单词,根据单词中的相邻的文字框之间的角度差,检测该单词是否为弯曲文字,将弯曲文字的文字框之间插入空格,将处理后的弯曲文字输入文字识别模型进行文字识别。从而,实现弯曲文字的检测和识别。
技术领域
本公开涉及文字识别领域,特别涉及一种弯曲文字识别方法和装置。
背景技术
目前人工智能领域,单发多框检测(single shot multibox detection,简称SSD)方法仅能够对水平文字进行检测,其延伸出的Seglink方法也仅能对同一直线上的倾斜文字进行检测。相关技术均无法对弯曲文字进行检测。
发明内容
本公开提出一种能够检测和识别弯曲文字的方案。
本公开的一些实施例提出一种弯曲文字识别方法,包括:
获取待检测图像中的文字框以及各个文字框对应的单词;
根据单词中的相邻的文字框之间的角度差,检测该单词是否为弯曲文字;
将弯曲文字的文字框之间插入空格;
将处理后的弯曲文字输入文字识别模型进行文字识别。
在一些实施例中,待检测图像中的文字框通过将待检测图像输入卷积神经网络CNN算法来获得,
其中,卷积神经网络算法预先利用文字样本进行训练。
在一些实施例中,各个文字框对应的单词通过将各个文字框输入深度优先搜索DFS算法来获得。
在一些实施例中,如果单词中的相邻的文字框之间的角度差处于最小阈值和最大阈值之间,该单词被判定为弯曲文字。
在一些实施例中,如果单词中的相邻的文字框之间的角度差小于或等于最小阈值,该单词被判定为非弯曲文字;
如果单词中的相邻的文字框之间的角度差大于或等于最大阈值,拆分该单词。
在一些实施例中,还包括:
将非弯曲文字以及非弯曲文字中的各个文字框的角度均值信息输入文字识别模型进行文字识别。
在一些实施例中,所述文字识别模型为联结主义时间分类CTC文字识别模型。
在一些实施例中,把每个文字框作为节点来建立图模型,用DFS算法从图模型中找连通分量,每个连通分量为一个单词。
本公开的一些实施例提出一种弯曲文字识别装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行前述任一个实施例的弯曲文字识别方法。
本公开的一些实施例提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述任一个实施例的弯曲文字识别方法。
附图说明
下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍。根据下面参照附图的详细描述,可以更加清楚地理解本公开,
显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开一些实施例的弯曲文字识别方法的流程示意图。
图2为本公开一些实施例的弯曲文字识别装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811379524.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:业务保护方法和装置
- 下一篇:实现网络遥测的方法、设备和系统





