[发明专利]一种基于图像分割的工件金属表面文字识别方法及系统有效

专利信息
申请号: 201911373220.8 申请日: 2019-12-27
公开(公告)号: CN111160352B 公开(公告)日: 2023-04-07
发明(设计)人: 徐辉;陆强;袁智超;孙天齐 申请(专利权)人: 创新奇智(北京)科技有限公司
主分类号: G06V30/148 分类号: G06V30/148;G06V30/19;G06V10/82;G06N3/0464
代理公司: 深圳珠峰知识产权代理有限公司 44899 代理人: 黄伟
地址: 100080 北京市海淀区海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图像 分割 工件 金属表面 文字 识别 方法 系统
【权利要求书】:

1.一种基于图像分割的工件金属表面文字识别方法,其特征在于,具体包括以下步骤:

步骤S1,获取工件金属表面的文本行图像;

步骤S2,根据预先生成的文字识别模型对所述文本行图像进行特征提取,得到所述文本行图像对应的语义分割掩码图和实例分割掩码图;

步骤S3,根据所述语义分割掩码图处理得到所述文本行图像中的若干文字区域;

步骤S4,根据所述实例分割掩码图处理得到各所述文字区域的文字类别;

步骤S5,根据所述文字区域的二维坐标位置和所述文字类别处理得到所述文本行图像的文字识别结果;

基于图像分割的工件金属表面文字识别方法还包括一预先生成所述文字识别模型的过程,具体包括:

步骤A1,获取所述工件金属表面的若干文本行图像,并对各所述文本行图像进行字符级别的标注,得到包含字符标注信息的标注图像;

所述字符标注信息包括图像中各字符的真实位置区域和真实类别信息;

步骤A2,将各所述标注图像输入具有预设参数的初始识别模型中进行特征提取,得到所述标注图像对应的语义分割掩码图和实例分割掩码图;

步骤A3,分别计算所述语义分割掩码图中各字符的预测位置区域和对应的所述真实位置区域之间的第一交叉熵损失,以及所述实例分割掩码图中各字符的预测类别信息与对应的所述真实类别信息之间的第二交叉熵损失;

步骤A4,对所述第一交叉熵损失和所述第二交叉熵损失求和得到所述初始识别模型的总交叉熵损失,并将所述总交叉熵损失与预设的损失阈值进行比较:

若所述总交叉熵损失不小于所述损失阈值,则转向步骤A5;

若所述总交叉熵损失小于所述损失阈值,则转向步骤A6;

步骤A5,对所述预设参数进行调整,随后返回所述步骤A2;

步骤A6,将所述初始识别模型作为文字识别模型进行保存。

2.根据权利要求1所述的基于图像分割的工件金属表面文字识别方法,其特征在于,所述文字识别模型的网络架构具体包括:

普通卷积层,所述普通卷积层包括卷积核大小为3x3且步长为2的卷积层、BN层和RELU层,且所述普通卷积层的输出通道为32;

第一残差卷积块,连接所述普通卷积层,所述第一残差卷积块包括一个深度可分离卷积,所述深度可分离卷积的卷积核大小为3x3,步长为1,且所述第一残差卷积块的输出通道为16;

第二残差卷积块,连接所述第一残差卷积块,所述第二残差卷积块包括一第一深度可分离卷积和一第二深度可分离卷积,且所述第一深度可分离卷积的卷积核大小为3x3,步长为2,输出通道为24,所述第二深度可分离卷积的卷积核大小的卷积核大小为3x3,步长为1,输出通道为24;

第三残差卷积块,连接所述第二残差卷积块,所述第三残差卷积块包括一第三深度可分离卷积、一第四深度可分离卷积和一第五深度可分离卷积,且所述第三深度可分离卷积的卷积核大小为3x3,步长为2,输出通道为32,所述第四深度可分离卷积的卷积核大小的卷积核大小为3x3,步长为1,输出通道为32,所述第五深度可分离卷积的卷积核大小的卷积核大小为3x3,步长为1,输出通道为32;

第四残差卷积块,连接所述第三残差卷积块,所述第四残差卷积块包括四个第六深度可分离卷积,且各所述第六深度可分离卷积的卷积核大小为3x3,步长为1,输出通道为64;

第五残差卷积块,连接所述第四残差卷积块,所述第五残差卷积块包括三个第七深度可分离卷积,且各所述第七深度可分离卷积的卷积核大小为3x3,步长为1,输出通道为96;

第六残差卷积块,连接所述第五残差卷积块,所述第六残差卷积块包括三个第八深度可分离卷积,且各所述第八深度可分离卷积的卷积核大小为3x3,步长为1,输出通道为160;

第七残差卷积块,连接所述第六残差卷积块,所述第七残差卷积块包括一第九深度可分离卷积,且所述第九深度可分离卷积的卷积核大小为3x3,步长为1,输出通道为320;

第八残差卷积块,连接所述第七残差卷积块,所述第八残差卷积块的输出层经两个不同的卷积上采样后分别生成语义分割掩码图和实例分割掩码图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(北京)科技有限公司,未经创新奇智(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911373220.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top