[发明专利]文本检测方法、装置、存储介质及电子设备有效
| 申请号: | 202110221984.6 | 申请日: | 2021-02-28 |
| 公开(公告)号: | CN112580638B | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 李盼盼;秦勇 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 李丽 |
| 地址: | 100043 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 检测 方法 装置 存储 介质 电子设备 | ||
本发明实施例提供了一种文本检测方法、装置、存储介质及电子设备,文本检测方法,包括:获取待文本检测图像;获取所述待文本检测图像的各个文本区域的中心点的中心点坐标和各个文本区域的预定数量的文本区域边界点的边界点偏移量,其中,所述边界点偏移量为各个所述文本区域边界点相对于所述文本区域的中心点的各个偏移量;根据所述边界点偏移量和所述中心点坐标,获取各个所述文本区域边界点的边界点坐标。本发明实施例所提供的文本检测方法、装置、存储介质及电子设备,可以减小文本检测的计算量,缩短计算时间。
技术领域
本发明实施例涉及计算机领域,尤其涉及一种文本检测方法、装置、存储介质及电子设备。
背景技术
文本检测的目的是定位文本行或字符在图像中的位置,是很多计算机视觉任务的前置步骤,比如:文字识别、身份认证、视觉导航等。
然而,由于文本具有多方向、角度倾斜、形状不规则、极端长宽比、字体多样、颜色多样、背景多样等特点,通用的目标检测算法无法直接迁移到文字检测中。
目前,所采用的文本检测方法主要包括:1、基于滑动窗口的文本检测方法,首先设置大量不同长宽比、不同大小的锚点框,然后以锚点框为滑动窗口,在图像或者经对图像进行卷积操作得到的特征图上进行遍历搜索,对每个搜索到的位置框进行框内是否全部是文本且包括全部文本的判断,然而这种方法需要对每个位置框进行判断,这就造成了计算量过大,需要大量的计算资源和较长的计算时间的问题;2、基于连通域计算的方法,首先获取待文本检测图像的特征图,然后对特征图进行二值化处理并计算连通域,进而确定文本行的位置,然而连通域的计算量与待文本检测图像的像素点的多少直接相关,当待文本检测图像的像素点较多时,计算量很大,消耗大量的计算资源和计算时间。
因此,如何减小文本检测的计算量,缩短计算时间,就成为亟需解决的技术问题。
发明内容
本发明实施例提供一种文本检测方法、装置、存储介质及电子设备,以减小文本检测的计算量,缩短计算时间。
为解决上述问题,本发明实施例提供一种文本检测方法,包括:
获取待文本检测图像;
获取所述待文本检测图像的各个文本区域的中心点的中心点坐标和各个文本区域的预定数量的文本区域边界点的边界点偏移量,其中,所述边界点偏移量为各个所述文本区域边界点相对于所述文本区域的中心点的各个偏移量;
根据所述边界点偏移量和所述中心点坐标,获取各个所述文本区域边界点的边界点坐标。
为解决上述问题,本发明实施例还提供一种文本检测装置,包括:
文本检测图像获取单元,适于获取待文本检测图像;
中心点坐标和边界点偏移量获取单元,适于获取所述待文本检测图像的各个文本区域的中心点的中心点坐标和各个文本区域的预定数量的文本区域边界点的边界点偏移量,其中,所述边界点偏移量为各个所述文本区域边界点相对于所述文本区域的中心点的各个偏移量;
边界点坐标获取单元,适于根据所述边界点偏移量和所述中心点坐标,获取各个所述文本区域边界点的边界点坐标。
为解决上述问题,本发明实施例提供一种存储介质,所述存储介质存储有适于文本检测的程序,以实现如前述任一实施例所述的文本检测方法。
为解决上述问题,本发明实施例提供一种电子设备,包括至少一个存储器和至少一个处理器;所述存储器存储有程序,所述处理器调用所述程序,以执行如前述任一实施例所述的文本检测方法。
与现有技术相比,本发明的技术方案具有以下优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110221984.6/2.html,转载请声明来源钻瓜专利网。





