[发明专利]一种自然场景下端到端文本识别方法有效
| 申请号: | 201910371620.9 | 申请日: | 2019-05-06 |
| 公开(公告)号: | CN110135419B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 李武军;陈雨 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/19 |
| 代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
| 地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自然 场景 下端 文本 识别 方法 | ||
本发明公开了一种自然场景下端到端文本识别方法,包括用自然场景图片及真实标记训练框架以及对自然场景图片上文本区域及内容进行预测:训练阶段中,收集包含文本的自然场景下的图片、构建包含文本位置与内容的数据集、定义标准的端到端文本识别框架、使用真实检测标记训练检测部分、使用近邻相关边界优化算法优化检测区域、使用优化后的检测区域输入进识别部分中以训练识别部分参数、保存训练好的框架参数至数据平台;测试阶段中,读取训练好的框架参数、输入测试图像、检测阶段检测文本区域、采用基于近邻相关性边界优化算法优化检测区域、将优化后的检测区域送入识别部分进行文本识别。
技术领域
本发明涉及一种基于近邻相关性边界优化算法的自然场景下端到端文本识别方法,涉及自然场景下端到端文本识别,特别适用于检测区域边界不精确导致识别失败的问题。
背景技术
自然场景下的端到端文本识别任务目的为,输入一张包含文本区域的自然场景图片,既要检测出图片位置,也要识别出相应位置文本内容。在端到端文本识别任务中,识别阶段的精确度受检测阶段精确度的影响很高,只有检测阶段精确地框住了文本中所有的字母,识别阶段才能输出精确的识别结果。特别的,现有端到端文本框架对于长文本或大文本区域的边界预测不准确,这给后续的识别任务带来了一定的困难。
现有常用的后处理算法如非极大抑制(Non-Maximum Suppression,简称NMS)算法,或局部感知非极大抑制(Locality-Aware NMS,简称LANMS)算法,只能将相邻且交并比大的区域做合并,未对边界的精确性做要求,这就导致了检测过程可能得到不精确的边界,从而影响识别结果。
发明内容
发明目的:目前的端到端文本识别框架中,并未对检测结果的边界精确性做明确要求,现有框架对于长文本、大文本的检测结果通常边界不精确,甚至没有将文本完整框出,这导致了识别结果的不准确。针对上述问题,本发明设计了基于近邻相关性的边界优化算法,发明了采用该算法的端到端文本识别深度学习框架,方法表述了框架结构、框架训练过程、框架测试过程,以此来解决边界预测不精确的问题,提高端到端任务的精度。
技术方案:一种自然场景下端到端文本识别方法,包括基于近邻相关性边界优化算法的端到端文本识别深度学习框架训练,以及利用训练好的框架对自然场景中文本区域及内容进行端到端识别的测试过程。
所述基于近邻相关性边界优化算法的端到端文本识别深度学习框架训练的具体步骤为:
步骤100,输入自然场景图像、真实标记区域、真实标记串至数据处理平台;
步骤101,对输入自然场景图片做预处理,进行随机旋转、采样、正规化等操作;
步骤102,使用真实标记区域生成真实类图与真实几何图以作为训练监督信息;
步骤103,初始化整个框架的共享特征部分、检测部分、识别部分各部分的权重;
步骤104,在数据处理平台上,使用自然场景图像、真实类图、真实几何图、真实标记串,用端到端的方法训练整个框架;其步骤为:自然场景图像首先经过共享特征部分,得到共享特征图;检测部分利用共享特征图生成检测结果;近邻相关性边界优化算法优化检测结果;作用在共享特征图上的双线性插值将检测区域采样得到识别特征;识别部分利用输入的识别特征得到识别结果;
步骤105,输出并保存框架各部分权重至数据处理平台的存储系统。
利用训练好的基于近邻相关性边界优化算法的端到端文本识别深度学习框架,对自然场景中文本区域及内容进行端到端识别的测试,测试具体步骤为:
步骤200,输入自然场景图像至数据处理平台;
步骤201,读取已保存的训练好的框架各部分权重,包括共享特征部分、检测部分、识别部分各部分的权重;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910371620.9/2.html,转载请声明来源钻瓜专利网。





