[发明专利]一种文本检测方法及系统有效

申请号：	202110262754.4	申请日：	2021-03-11
公开（公告）号：	CN112966678B	公开（公告）日：	2023-01-24
发明（设计）人：	江少锋;杨素华;陈震;张聪炫	申请（专利权）人：	南昌航空大学
主分类号：	G06V10/22	分类号：	G06V10/22;G06V10/26;G06V10/28;G06V10/774;G06V30/10;G06V30/14;G06V30/162;G06V30/19
代理公司：	北京高沃律师事务所 11569	代理人：	刘凤玲
地址：	330000 江***	国省代码：	江西;36
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本检测方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种文本检测方法及系统。该文本检测方法包括包括：训练阶段和检测阶段；训练阶段的步骤包括：获取待训练图像；对待训练图像进行垂直投影处理并利用垂直投影中的空白间隙完成文字的分割，得到待训练标签数据；将待训练标签数据输入文本检测模型中进行训练，得到经训练文本检测模型；检测阶段的步骤包括：获取待测文本图像；将待测文本图像输入经训练文本检测模型中生成包含检测结果的文本检测框。本发明的文本检测方法及系统能包含完整的文本信息，克服对长文本检测效果不佳的缺陷，同时能够有效去除非文本信息。

技术领域

本发明涉及OCR(Optical CharacterRecognition，光学字符识别)领域，特别是涉及一种文本检测方法及系统。

背景技术

OCR(Optical Character Recognition，光学字符识别)技术主要包括文本检测与文本识别两个部分，精准的文本检测是文本识别的前提。现有的OCR 技术在检测简单文档时表现良好。但是，在检测包含大量非文本信息(图标，表格，签名，印章，噪声等)的复杂文档时，大多数OCR系统经常将这些非文本信息误认为文本，从而导致检测效果不佳。

目前文本检测方法主要分为两大类：传统算法的文本检测方法和深度学习的文本检测方法。深度学习的文本检测方法主要利用Anchor策略和分割策略进行文本检测，由于利用了高层的语义信息，对文本和非文本区域有较高的辨识能力。利用大量的数据进行训练，能够获得更加复杂，泛化能力更好的模型，在文本检测任务中取得了突破性的进展。但是还存在一些不足，利用Anchor 策略的检测方法例如CTPN，Seglink等方法，由于文本图像中大量存在长宽比例过大的长文本信息，直接利用Anchor策略将会导致检测框难以完整检测到文本信息。

发明内容

基于此，有必要提供一种文本检测方法及系统能够包含完整的文本信息，克服对长文本检测效果不佳的缺陷，同时能够有效去除非文本信息。

为实现上述目的，本发明提供了如下方案：

一种文本检测方法，包括：训练阶段和检测阶段；

所述训练阶段的步骤包括：

获取待训练图像；

对所述待训练图像进行垂直投影处理并利用垂直投影中的空白间隙完成文字的分割，得到待训练标签数据；

将所述待训练标签数据输入文本检测模型中进行训练，得到经训练文本检测模型；

所述检测阶段的步骤包括：

获取待测文本图像；

将所述待测文本图像输入所述经训练文本检测模型中生成包含检测结果的文本检测框。

可选的，所述文本检测模型为改进型yolov5模型；