[发明专利]文本区域检测模型的建立方法以及装置在审
| 申请号: | 202010195913.9 | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN113496223A | 公开(公告)日: | 2021-10-12 |
| 发明(设计)人: | 喻雨峰 | 申请(专利权)人: | 顺丰科技有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06N3/04;G06N3/08 |
| 代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 远明 |
| 地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 区域 检测 模型 建立 方法 以及 装置 | ||
本申请实施例提供了文本区域检测模型的建立方法以及装置,所建立得到的文本区域检测模型,可大大提高图像中的文本区域的检测效率。本申请实施例提供了一种文本区域检测模型的建立方法,方法包括:获取训练集,其中,训练集包括标注有文本区域的图像;在图像中,基于文本区域中的每个特征点到文本区域的边界的最小距离,确定文本区域的特征信息;结合图像以及特征信息,训练初始神经网络模型,并将训练完成的模型作为文本区域检测模型,其中,文本区域检测模型用于检测待检测图像中的文本区域。
技术领域
本申请涉及图像识别领域,具体涉及文本区域检测模型的建立方法以及装置。
背景技术
光学字符识别(Optical Character Recognition,OCR)技术,可对包含文本内容的图像进行分析识别处理,提取图像所包含的文字,减少人工手动录入,提高工作效率,降低人工录入失误。
OCR技术在识别文字的过程中,起数据处理主要包括两个环节,分别是检测文字环节以及识别文字环节,检测文字环节可先通过检测文本框的方式,确定文字在图像中的所在位置,也可以说确定文字所在的文本区域,再由识别文字环节识别文本区域中的文字。
而在现有的相关技术中,其检测文本区域的检测效率较低,进而导致了整个文本识别的识别效率较低。
发明内容
本申请实施例提供了文本区域检测模型的建立方法以及装置,所建立得到的文本区域检测模型,可大大提高图像中的文本区域的检测效率。
第一方面,本申请实施例提供了一种文本区域检测模型的建立方法,方法包括:
获取训练集,其中,训练集包括标注有文本区域的图像;
在图像中,基于文本区域中的每个特征点到文本区域的边界的最小距离,确定文本区域的特征信息;
结合图像以及特征信息,训练初始神经网络模型,并将训练完成的模型作为文本区域检测模型,其中,文本区域检测模型用于检测待检测图像中的文本区域。
结合本申请实施例第一方面,在本申请实施例第一方面第一种可能的实现方式中,在图像中,基于文本区域中的每个特征点到文本区域的边界的最小距离,确定文本区域的特征信息包括:
在图像中,计算文本区域中的每个特征点到文本区域的边界的最小距离;
在图像中,提取文本区域的边界;
基于文本区域中的每个特征点到文本区域的边界的最小距离,以及边界,确定文本区域的特征信息。
结合本申请实施例第一方面第一种可能的实现方式,在本申请实施例第一方面第二种可能的实现方式中,基于文本区域中的每个特征点到文本区域的边界的最小距离,以及边界,确定文本区域的特征信息包括:
将文本区域中的每个特征点到文本区域的边界的最小距离的特征图像的掩模图像,减去边界的特征图像的掩模图像,并将得到的目标掩模图像识别为文本区域的特征信息。
结合本申请实施例第一方面第二种可能的实现方式,在本申请实施例第一方面第三种可能的实现方式中,将文本区域中的每个特征点到文本区域的边界的最小距离的特征图像的掩模图像,减去边界的特征图像的掩模图像包括:
将文本区域中的每个特征点到文本区域的边界的最小距离的特征图像的掩模图像,减去边界的特征图像的掩模图像的K倍放大结果,其中,K为预置放大系数。
结合本申请实施例第一方面第二种可能的实现方式,在本申请实施例第一方面第四种可能的实现方式中,将得到的目标掩膜图像识别为文本区域的特征信息包括:
基于目标掩膜图像进行二值化处理以及开运算处理,得到至少一个联通区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010195913.9/2.html,转载请声明来源钻瓜专利网。





