[发明专利]一种通用场景文本检测识别的预处理模型训练方法及系统在审
| 申请号: | 202210209485.X | 申请日: | 2022-03-03 |
| 公开(公告)号: | CN114581650A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 马凤强;吴运祥;李晗;刘琛;安晓博 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
| 主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/24;G06V10/774;G06V30/148;G06K9/62 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜鹏 |
| 地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 通用 场景 文本 检测 识别 预处理 模型 训练 方法 系统 | ||
1.一种通用场景文本检测识别的预处理模型训练方法,其特征是所述的方法具体步骤如下:
S1获取标注好的文本数据集,对图片进行copypaste数据增强操作后送入文本检测网络学习文本区域特征,得到文本检测模型;
S2获取文本数据集图片,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行裁剪,将数据划分为0°和180°两类后送入图像分类网络学习图像特征,得到文本方向分类模型;
S3获取文本数据集,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行剪裁,对图片进行TIA数据增广,将其数据输入到文字识别网络学习文字特征,得到文字识别模型。
2.根据权利要求1所述的方法,其特征是所述S1的具体步骤如下:
S101获取场景文本检测与识别数据集并进行标注,标注图片中的文字四点坐标位置,文本方向信息以及文本内容;
S102根据获取到的图片进行copypaste数据增强,将图片中的文本区域随机进行裁剪,并将裁剪出来的文本图片随机贴到另外一张图片的没有文字信息的位置;
S103根据获取到的图片组成batch送入到文本检测网络,采用余弦学习率下降方式以及学习率预热,得到文本检测模型。
3.根据权利要求2所述的方法,其特征是所述S2的具体步骤如下:
S201根据获取到的数据集,根据图片的文字四点坐标位置计算得到最长边的两个坐标点,由这两个坐标点计算长边斜率k,根据斜率k计算角度θ,将原始图片按照文本方向旋转θ后摆正进行裁剪。
S202根据步获取到的图片,将图片分为0°和180°两类,为平衡两类图片数量,将0°图片旋转180°作为另外一类图像;
S203根据获取到的图片组成batch送入到图像分类网络学习图像特征,得到文本方向分类模型。
4.根据权利要求3所述的方法,其特征是所述S3的具体步骤如下:
S301对获取到的图片进行随机的TIA数据增广,将图片平均分为N个斑块,并沿图像上下边界初始化2(N+1)个基准点p,并通过遵循一定的分布,将靶标点随机地移动到以p为圆心,半径为R的q处来增强原始图像;
S302根据获取到的图片组成batch送入到文字识别网络,采用策略学习文字特征得到文字识别模型。
5.一种通用场景文本检测识别的预处理模型训练系统,其特征是所述的系统具体包括文本检测模块、文本方向分类模块和文字识别模块:
文本检测模块:获取标注好的文本数据集,对图片进行copypaste数据增强操作后送入文本检测网络学习文本区域特征,得到文本检测模型;
文本方向分类模块:获取文本数据集图片,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行裁剪,将数据划分为0°和180°两类后送入图像分类网络学习图像特征,得到文本方向分类模型;
文字识别模块:获取文本数据集,计算文字区域长边角度θ,根据角度旋转原图片并对旋转后水平区域进行剪裁,对图片进行TIA数据增广,将其数据输入到文字识别网络学习文字特征,得到文字识别模型。
6.根据权利要求5所述的系统,其特征是所述文本检测模块具体包括数据收集模块A、数据增强模块和网络检测模块:
数据收集模块A:获取场景文本检测与识别数据集并进行标注,标注图片中的文字四点坐标位置,文本方向信息以及文本内容;
数据增强模块:根据获取到的图片进行copypaste数据增强,将图片中的文本区域随机进行裁剪,并将裁剪出来的文本图片随机贴到另外一张图片的没有文字信息的位置;
网络检测模块:根据获取到的图片组成batch送入到文本检测网络,采用余弦学习率下降方式以及学习率预热,得到文本检测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210209485.X/1.html,转载请声明来源钻瓜专利网。





