[发明专利]箱式结构的文本识别方法、装置及电子设备在审

专利信息
申请号: 202110711344.3 申请日: 2021-06-25
公开(公告)号: CN113496212A 公开(公告)日: 2021-10-12
发明(设计)人: 郭双双;龚星;郭卉;谢骏;曾锴;王谦;刘庆;蔡俩志;郑双智;陈丽萍;林文化;蒋哲兴;侯嘉悦;郝红;杨刚刚;戚恩 申请(专利权)人: 腾讯云计算(北京)有限责任公司;中国外运股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京派特恩知识产权代理有限公司 11270 代理人: 赵翠萍;张颖玲
地址: 100190 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 箱式 结构 文本 识别 方法 装置 电子设备
【说明书】:

本申请提供了一种箱式结构的文本识别方法、装置、电子设备及计算机可读存储介质;方法包括:对所述箱式结构的图像进行特征提取处理;基于提取得到的特征对所述图像进行字段级文本区域分割处理,得到字段级分割结果;基于提取得到的特征对所述图像进行单字符级检测处理,得到字符级检测结果;基于所述字符级检测结果,确定对应所述字符级检测结果的字符类别;基于所述字符类别以及所述字段级分割结果,确定所述箱式结构的字段识别结果;对所述字段识别结果进行结构化信息提取处理,得到所述箱式结构上的文本信息。通过本申请,能够提高箱式结构的文本识别准确度。

技术领域

本申请涉及人工智能技术,尤其涉及一种箱式结构的文本识别方法、装置、电子设备及计算机可读存储介质。

背景技术

人工智能(Artificial Intelligence,AI)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

箱式结构的文本识别是人工智能领域的重要应用之一,能够利用计算机对图像进行处理、分析和理解,以识别图像中的文本信息。

虽然,相关技术中的箱式结构的文本识别系统能够识别图像中所包括的箱式结构的文本。但是,相关技术中箱式结构的文本识别不够精确。

发明内容

本申请实施例提供一种箱式结构的文本识别方法、装置、电子设备及计算机可读存储介质,能够提高箱式结构的文本识别准确度。

本申请实施例的技术方案是这样实现的:

本申请实施例提供一种箱式结构的文本识别方法,包括:

对所述箱式结构的图像进行特征提取处理;

基于提取得到的特征对所述图像进行字段级文本区域分割处理,得到字段级分割结果;

基于提取得到的特征对所述图像进行单字符级检测处理,得到字符级检测结果;

基于所述字符级检测结果,确定对应所述字符级检测结果的字符类别;

基于所述字符类别以及所述字段级分割结果,确定所述箱式结构的字段识别结果;

对所述字段识别结果进行结构化信息提取处理,得到所述箱式结构上的文本信息。

本申请实施例提供一种箱式结构的文本识别装置,包括:特征模块,用于对所述箱式结构的图像进行特征提取处理;字符检测与字段分割模块,用于基于提取得到的特征对所述图像进行字段级文本区域分割处理,得到字段级分割结果;所述字符检测与字段分割模块,还用于基于提取得到的特征对所述图像进行单字符级检测处理,得到字符级检测结果;字符类别确定模块,用于基于所述字符级检测结果,确定对应所述字符级检测结果的字符类别;字段识别模块,用于基于所述字符类别以及所述字段级分割结果,确定所述箱式结构的字段识别结果;文本提取模块,用于对所述字段识别结果进行结构化信息提取处理,得到所述箱式结构上的文本信息。

在上述方案中,所述特征提取处理是通过调用特征提取网络实现的,所述特征提取网络包括多尺度特征提取网络以及多尺度特征融合网络,所述特征模块,还用于:通过所述多尺度特征提取网络对所述箱式结构的图像进行多尺度特征提取处理,得到所述箱式结构的多个尺度的子特征;通过所述多尺度特征融合网络对所述多个尺度的子特征进行融合处理,得到所述箱式结构的特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯云计算(北京)有限责任公司;中国外运股份有限公司,未经腾讯云计算(北京)有限责任公司;中国外运股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110711344.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top