[发明专利]一种自然场景下端到端文本识别方法有效
| 申请号: | 201910371620.9 | 申请日: | 2019-05-06 |
| 公开(公告)号: | CN110135419B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 李武军;陈雨 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/19 |
| 代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
| 地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种自然场景下端到端文本识别方法,包括用自然场景图片及真实标记训练框架以及对自然场景图片上文本区域及内容进行预测:训练阶段中,收集包含文本的自然场景下的图片、构建包含文本位置与内容的数据集、定义标准的端到端文本识别框架、使用真实检测标记训练检测部分、使用近邻相关边界优化算法优化检测区域、使用优化后的检测区域输入进识别部分中以训练识别部分参数、保存训练好的框架参数至数据平台;测试阶段中,读取训练好的框架参数、输入测试图像、检测阶段检测文本区域、采用基于近邻相关性边界优化算法优化检测区域、将优化后的检测区域送入识别部分进行文本识别。 | ||
| 搜索关键词: | 一种 自然 场景 下端 文本 识别 方法 | ||
【主权项】:
1.一种基于近邻相关性边界优化算法的自然场景下端到端文本识别方法,其特征在于,包括基于近邻相关性边界优化算法的端到端文本识别深度学习框架训练,以及利用训练好的框架对自然场景中文本区域及内容进行端到端识别的测试过程;所述基于近邻相关性边界优化算法的端到端文本识别深度学习框架训练的具体步骤为:步骤100,输入自然场景图像、真实标记区域、真实标记串至数据处理平台;步骤101,对输入自然场景图片做预处理;步骤102,使用真实标记区域生成真实类图与真实几何图以作为训练监督信息;步骤103,初始化整个框架的共享特征部分、检测部分、识别部分各部分的权重;步骤104,在数据处理平台上,使用自然场景图像、真实类图、真实几何图、真实标记串,用端到端的方法训练整个框架;其步骤为:自然场景图像首先经过共享特征部分,得到共享特征图;检测部分利用共享特征图生成检测结果;近邻相关性边界优化算法优化检测结果;作用在共享特征图上的双线性插值将检测区域采样得到识别特征;识别部分利用输入的识别特征得到识别结果;步骤105,输出并保存框架各部分参数至数据处理平台的存储系统。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910371620.9/,转载请声明来源钻瓜专利网。





