[发明专利]文本区域检测模型的建立方法以及装置在审

申请号：	202010195913.9	申请日：	2020-03-19
公开（公告）号：	CN113496223A	公开（公告）日：	2021-10-12
发明（设计）人：	喻雨峰	申请（专利权）人：	顺丰科技有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06N3/04;G06N3/08
代理公司：	深圳紫藤知识产权代理有限公司 44570	代理人：	远明
地址：	518000 广东省深圳市南山区学府路（以南）***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本区域检测模型建立方法以及装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了文本区域检测模型的建立方法以及装置，所建立得到的文本区域检测模型，可大大提高图像中的文本区域的检测效率。本申请实施例提供了一种文本区域检测模型的建立方法，方法包括：获取训练集，其中，训练集包括标注有文本区域的图像；在图像中，基于文本区域中的每个特征点到文本区域的边界的最小距离，确定文本区域的特征信息；结合图像以及特征信息，训练初始神经网络模型，并将训练完成的模型作为文本区域检测模型，其中，文本区域检测模型用于检测待检测图像中的文本区域。

技术领域

本申请涉及图像识别领域，具体涉及文本区域检测模型的建立方法以及装置。

背景技术

光学字符识别(Optical Character Recognition，OCR)技术，可对包含文本内容的图像进行分析识别处理，提取图像所包含的文字，减少人工手动录入，提高工作效率，降低人工录入失误。

OCR技术在识别文字的过程中，起数据处理主要包括两个环节，分别是检测文字环节以及识别文字环节，检测文字环节可先通过检测文本框的方式，确定文字在图像中的所在位置，也可以说确定文字所在的文本区域，再由识别文字环节识别文本区域中的文字。

而在现有的相关技术中，其检测文本区域的检测效率较低，进而导致了整个文本识别的识别效率较低。

发明内容

本申请实施例提供了文本区域检测模型的建立方法以及装置，所建立得到的文本区域检测模型，可大大提高图像中的文本区域的检测效率。

第一方面，本申请实施例提供了一种文本区域检测模型的建立方法，方法包括：

获取训练集，其中，训练集包括标注有文本区域的图像；

在图像中，基于文本区域中的每个特征点到文本区域的边界的最小距离，确定文本区域的特征信息；

结合图像以及特征信息，训练初始神经网络模型，并将训练完成的模型作为文本区域检测模型，其中，文本区域检测模型用于检测待检测图像中的文本区域。

结合本申请实施例第一方面，在本申请实施例第一方面第一种可能的实现方式中，在图像中，基于文本区域中的每个特征点到文本区域的边界的最小距离，确定文本区域的特征信息包括：

在图像中，计算文本区域中的每个特征点到文本区域的边界的最小距离；

在图像中，提取文本区域的边界；

基于文本区域中的每个特征点到文本区域的边界的最小距离，以及边界，确定文本区域的特征信息。

结合本申请实施例第一方面第一种可能的实现方式，在本申请实施例第一方面第二种可能的实现方式中，基于文本区域中的每个特征点到文本区域的边界的最小距离，以及边界，确定文本区域的特征信息包括：

将文本区域中的每个特征点到文本区域的边界的最小距离的特征图像的掩模图像，减去边界的特征图像的掩模图像，并将得到的目标掩模图像识别为文本区域的特征信息。

结合本申请实施例第一方面第二种可能的实现方式，在本申请实施例第一方面第三种可能的实现方式中，将文本区域中的每个特征点到文本区域的边界的最小距离的特征图像的掩模图像，减去边界的特征图像的掩模图像包括：

将文本区域中的每个特征点到文本区域的边界的最小距离的特征图像的掩模图像，减去边界的特征图像的掩模图像的K倍放大结果，其中，K为预置放大系数。

结合本申请实施例第一方面第二种可能的实现方式，在本申请实施例第一方面第四种可能的实现方式中，将得到的目标掩膜图像识别为文本区域的特征信息包括：

基于目标掩膜图像进行二值化处理以及开运算处理，得到至少一个联通区域；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司，未经顺丰科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010195913.9/2.html，转载请声明来源钻瓜专利网。

上一篇：物流件的体积测量方法以及装置
下一篇：一种晶圆套刻量测方法、装置、存储介质及电子设备

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本区域检测模型的建立方法以及装置在审

专利文献下载