[发明专利]箱式结构的文本识别方法、装置及电子设备在审
| 申请号: | 202110711344.3 | 申请日: | 2021-06-25 |
| 公开(公告)号: | CN113496212A | 公开(公告)日: | 2021-10-12 |
| 发明(设计)人: | 郭双双;龚星;郭卉;谢骏;曾锴;王谦;刘庆;蔡俩志;郑双智;陈丽萍;林文化;蒋哲兴;侯嘉悦;郝红;杨刚刚;戚恩 | 申请(专利权)人: | 腾讯云计算(北京)有限责任公司;中国外运股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
| 地址: | 100190 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 箱式 结构 文本 识别 方法 装置 电子设备 | ||
1.一种箱式结构的文本识别方法,其特征在于,包括:
对所述箱式结构的图像进行特征提取处理;
基于提取得到的特征对所述图像进行字段级文本区域分割处理,得到字段级分割结果;
基于提取得到的特征对所述图像进行单字符级检测处理,得到字符级检测结果;
基于所述字符级检测结果,确定对应所述字符级检测结果的字符类别;
基于所述字符类别以及所述字段级分割结果,确定所述箱式结构的字段识别结果;
对所述字段识别结果进行结构化信息提取处理,得到所述箱式结构上的文本信息。
2.根据权利要求1所述的方法,其特征在于,所述特征提取处理是通过调用特征提取网络实现的,所述特征提取网络包括多尺度特征提取网络以及多尺度特征融合网络,所述对所述箱式结构的图像进行特征提取处理,包括:
通过所述多尺度特征提取网络对所述箱式结构的图像进行多尺度特征提取处理,得到所述箱式结构的多个尺度的子特征;
通过所述多尺度特征融合网络对所述多个尺度的子特征进行融合处理,得到所述箱式结构的特征。
3.根据权利要求2所述的方法,其特征在于,所述多尺度特征提取网络包括卷积层、池化层以及对应多个所述尺度的残差层,所述通过所述多尺度特征提取网络对所述箱式结构的图像进行多尺度特征提取处理,得到所述箱式结构的多个尺度的子特征,包括:
通过所述卷积层对所述图像进行卷积处理,得到卷积处理结果;
通过所述池化层对所述卷积处理结果进行池化处理,得到池化结果;
通过级联的与多个所述尺度一一对应的残差层对所述池化结果进行残差处理,得到所述箱式结构的多个尺度的子特征。
4.根据权利要求3所述的方法,其特征在于,所述通过级联的与多个所述尺度一一对应的残差层对所述池化结果进行残差处理,得到所述箱式结构的多个尺度的子特征,包括:
通过N个级联的残差层中的第n残差层,对所述第n残差层的输入进行残差处理,并
将所述第n残差层输出的第n残差处理结果传输到第n+1残差层以继续进行残差处理;
其中,n为取值从1开始递增的整数,且n的取值范围满足1≤n≤N-1,N为大于或等于2的整数;当n取值为1时,所述第n残差层的输入为所述池化结果,当n取值为2≤n≤N-1时,所述第n残差层的输入为第n-1残差层的残差处理结果,所述第n残差层的残差处理结果为对应所述尺度的子特征。
5.根据权利要求4所述的方法,其特征在于,所述多尺度特征融合网络包括至少一个融合层,所述通过所述多尺度特征融合网络对所述多个尺度的子特征进行融合处理,得到所述箱式结构的特征,包括:
当所述融合层的数目为1时,通过所述融合层对第N残差层输出的子特征以及第N-1残差层输出的子特征进行融合处理,得到所述箱式结构的特征;
当所述融合层的数目为多个时,通过M个级联的融合层中的第m融合层,对所述第m融合层的输入进行融合处理,并
将所述第m融合层输出的第m融合处理结果传输到第m+1融合层以继续进行融合处理;
其中,m为取值从1开始递增的整数,且m的取值范围满足1≤m≤M-1,M为N-1;当m取值为1时,所述第m融合层的输入为所述第N残差层输出的子特征以及所述第N-1残差层输出的子特征,当m取值为2≤m≤M-1时,所述第m融合层的输入为第m-1融合层的第m-1融合处理结果以及第N-m残差层输出的子特征,当m取值为M-1时,所述第m+1融合层的融合处理结果为所述箱式结构的特征。
6.根据权利要求1所述的方法,其特征在于,所述单字符检测处理是通过像素类别分类网络以及像素位置回归网络实现的,所述基于提取得到的特征对所述图像进行单字符级检测处理,得到字符级检测结果,包括:
通过所述像素类别分类网络对所述图像进行基于所述特征的像素检测处理,得到第一特征图;
通过所述像素位置回归网络对所述图像进行基于所述特征的像素位置回归处理,得到第二特征图;
将所述第一特征图以及所述第二特征图组合为所述字符级检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(北京)有限责任公司;中国外运股份有限公司,未经腾讯云计算(北京)有限责任公司;中国外运股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110711344.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于新能源混动变速器的润滑系统
- 下一篇:可穿戴超声监测装置





