[发明专利]一种通用场景文本检测识别的预处理模型训练方法及系统在审
| 申请号: | 202210209485.X | 申请日: | 2022-03-03 |
| 公开(公告)号: | CN114581650A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 马凤强;吴运祥;李晗;刘琛;安晓博 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
| 主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/24;G06V10/774;G06V30/148;G06K9/62 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
| 地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 通用 场景 文本 检测 识别 预处理 模型 训练 方法 系统 | ||
本发明公开了一种通用场景文本检测识别的预处理模型训练方法及系统,属于计算机视觉领域;所述的方法具体步骤如下:S1获取标注好的文本数据集,对图片进行copypaste数据增强操作后送入文本检测网络学习文本区域特征,得到文本检测模型;S2获取文本数据集图片,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行裁剪,将数据划分为0°和180°两类后送入图像分类网络学习图像特征,得到文本方向分类模型;S3获取文本数据集,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行剪裁,对图片进行TIA数据增广,将其数据输入到文字识别网络学习文字特征,得到文字识别模型。
技术领域
本发明公开一种通用场景文本检测识别的预处理模型训练方法及系统,涉及计算机视觉技术领域。
背景技术
随着计算机以及人工智能技术的发展,将现实场景中的文字信息,转化为电子设备可以处理的文本信息的应用场景越来越多。在文本检测与识别领域,文本检测与识别的数据标注成本相对普通的图像处理标注成本更高,通常难以获得足够的真实样本数据,并且数据集中大多会包含倾斜文本,若是根据标注好的文本区域坐标直接裁剪生成的文字识别数据背景会产生干扰信息影响文字识别模型识别精度。
传统的文字识别技术主要包括文本检测与文本识别两个模块,在模型训练时通常通过合成数据增加数据量,采用数据增强方式一般为旋转,翻转以及缩放等常规数据增强操作,并且裁剪出的文字识别数据集通常会包含大量冗余背景信息。该技术在处理单一场景下,例如对文档中文字识别效果较好,但是在两个场景差距较大,且训练数据量较小的情况下识别效果较差,使用同一个模型分别对自然场景下文字识别以及文档文字识别,由于自然场景下文字和文档中的文字相比尺度变化大,字体样式复杂等问题,使用同一个模型时文本检测与识别效果较差。
故本发明提出的一种通用场景文本检测识别的预处理模型训练方法及系统,以解决传统的混合场景文本检测与识别精度低的问题。
发明内容
本发明针对现有技术的问题,提供一种通用场景文本检测识别的预处理模型训练方法及系统,所采用的技术方案为:一种通用场景文本检测识别的预处理模型训练方法,所述的方法具体步骤如下:
S1获取标注好的文本数据集,对图片进行copypaste数据增强操作后送入文本检测网络学习文本区域特征,得到文本检测模型;
S2获取文本数据集图片,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行裁剪,将数据划分为0°和180°两类后送入图像分类网络学习图像特征,得到文本方向分类模型;
S3获取文本数据集,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行剪裁,对图片进行TIA数据增广,将其数据输入到文字识别网络学习文字特征,得到文字识别模型。
所述S1的具体步骤如下:
S101获取场景文本检测与识别数据集并进行标注,标注图片中的文字四点坐标位置,文本方向信息以及文本内容;
S102根据获取到的图片进行copypaste数据增强,将图片中的文本区域随机进行裁剪,并将裁剪出来的文本图片随机贴到另外一张图片的没有文字信息的位置;
S103根据获取到的图片组成batch送入到文本检测网络,采用余弦学习率下降方式以及学习率预热,得到文本检测模型。
所述S2的具体步骤如下:
S201根据获取到的数据集,根据图片的文字四点坐标位置计算得到最长边的两个坐标点,由这两个坐标点计算长边斜率k,根据斜率k计算角度θ,将原始图片按照文本方向旋转θ后摆正进行裁剪。
S202根据步获取到的图片,将图片分为0°和180°两类,为平衡两类图片数量,将0°图片旋转180°作为另外一类图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210209485.X/2.html,转载请声明来源钻瓜专利网。





