[发明专利]一种文本处理方法及相关装置有效

专利信息
申请号: 202110738496.2 申请日: 2021-06-30
公开(公告)号: CN113627242B 公开(公告)日: 2022-09-27
发明(设计)人: 李明;付彬;乔宇 申请(专利权)人: 中国科学院深圳先进技术研究院
主分类号: G06F16/33 分类号: G06F16/33;G06V10/774;G06V30/40
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 熊永强;陈聪
地址: 518055 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 处理 方法 相关 装置
【说明书】:

本申请公开了一种文本处理方法及相关装置。该方法包括:获取第一文本图片;第一文本图片为包括第一文本的图片;将第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片;文本矫正网络为利用第一文本中的每个字符的位置信息进行矫正的网络,第二文本的文本内容与第一文本的文本内容相同,第二文本图片中的第二文本为水平文本。本方法对于输入的文本图片,通过检测其包含的文本信息得到每个字符的位置信息,并利用该位置信息重构出每个字符的坐标框,再根据该坐标框对字符进行更精细的控制点采样,使得矫正后的文本更加水平,提高了文本矫正的准确率及效率,进而提高文本识别的准确率及效率。

技术领域

本申请涉及场景文本识别(scene text recognition,STR)技术领域,尤其涉及一种文本处理方法及相关装置。

背景技术

场景文本识别指的是通过将特定场景中包含文本信息的文本图片输入到程序中,由程序将输入的包含文本信息的文本图片转换成计算机可理解的文本符号。场景文本识别在计算机视觉领域中为一个重要的分支,在自动驾驶、盲人辅助等应用场景中有着重要作用及前景,提高场景文本识别的准确率及效率尤为重要。

目前的场景文本识别往往只对水平的文本信息有较高的识别准确率。对于文本图片中包含的倾斜甚至弯曲的文本,目前的场景文本识别方法很难对其正确识别。所以,在对文本图片包含的文本信息进行识别之前,通常需要将原本倾斜甚至弯曲的文本矫正为水平的文本。

因此,如何高效的对文本进行矫正,使提高场景文本识别的准确率及效率,成为了本领域技术人员重要的研究课题。

发明内容

本申请实施例提供了一种文本处理方法及相关装置,对于输入的文本图片,通过检测其包含的文本信息得到每个字符的位置信息,并利用该位置信息重构出每个字符的坐标框,再根据该坐标框对字符进行更精细的控制点采样,使得矫正后的文本更加水平,提高了文本矫正的准确率及效率,进而提高文本识别的准确率及效率。

第一方面,本申请实施例提供了一种文本处理方法,该方法包括:

获取第一文本图片;所述第一文本图片为包括第一文本的图片;

将所述第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片;所述文本矫正网络为利用所述第一文本中的每个字符的位置信息进行矫正的网络,所述第二文本的文本内容与所述第一文本的文本内容相同,所述第二文本图片中的所述第二文本为水平文本。

本申请实施例中,将获取的第一文本图片输入至文本矫正网络进行文本矫正。具体为,通过检测第一文本图片包括的第一文本信息得到每个字符的位置与几何信息,并利用该信息重构出每个字符的坐标框,再根据该坐标框对字符进行更精细的控制点采样,利用字符的控制点进行文本矫正,得到包括第二文本的第二文本图片。其中,第二文本图片中的第二文本的文本内容与第一文本图片中的第一文本的文本内容相同,但第二文本图片中的第二文本更加水平,更有利于对其进行文本识别。

目前常用的文本矫正方法,是使用文本级别的控制点采样方式进行文本矫正,忽略了字符本身的信息,因此,在采样的过程中可能会将文本扭曲,导致矫正后的文本图片不容易被识别。

与目前常用的文本矫正方法相比,本申请实施例中的方法,利用字符级别的控制点采样方式进行文本矫正,使得矫正后的文本图片中包括的文本更加水平,提高了文本矫正的准确率及效率,进而提高文本识别的准确率及效率。

在一种可能的实施方式中,所述将所述第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片,包括:

获取所述第一文本中的字符的各个不同层级的掩码;所述各个不同层级的掩码大小不同,所述各个不同层级的掩码用于表征所述字符的位置信息;

根据所述字符的位置信息构建所述字符的坐标框;所述坐标框用于确定所述字符的控制点;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110738496.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top