[发明专利]一种文本定位方法及装置、文本识别方法及装置有效

专利信息
申请号: 201910105748.0 申请日: 2019-02-01
公开(公告)号: CN109919037B 公开(公告)日: 2021-09-07
发明(设计)人: 刘正珍;黄威 申请(专利权)人: 汉王科技股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 莎日娜
地址: 100193 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 定位 方法 装置 识别
【说明书】:

本申请提供了一种文本识别方法,属于文本识别技术领域,解决了现有技术文本识别过程中准确率低下的问题。所述方法包括:获取待识别文本行图像;将所述待识别文本行图像输入至预先训练的文本行识别模型,确定所述待识别文本行图像对应的文本行识别结果,所述文本行识别结果用于指示所述待识别文本行图像相应位置处的文本行属性;根据文本行识别结果确定所述待识别文本行图像中与所述文本行属性对应的图像区域。本申请公开的文本定位方法通过训练的文本行识别模型确定复杂排布的待识别文本行图像中不同文本行属性的文本的分布区域,有助于针对不同的文本区域采用与该文本区域的文本行属性对应的文本图像识别引擎进行识别,以提升文本识别的准确性。

技术领域

本申请涉及文本识别技术领域,尤其涉及一种文本定位方法及装置,文本识别方法及装置。

背景技术

文档图像识别过程通常是将行文本的图像,或者列文本图像输入至预先训练的文本图像识别引擎以得到相应的文本编码。列文本通过旋转90度得到行文本,因此,通常把行文本和列文本统称为行文本。

现有技术中的文本图像识别引擎是基于单行文本的图像或单列文本的图像进行训练的,因此,对于输入的文本图像中混合分布的单行文本和多行文本的情况,文本图像识别引擎均将其作为单行文本进行识别。

例如,古籍文档中,最常见的就是由单列正文文本和两列注释文本的文本行图像,而现有的文本图像识别引擎会将两列注释文本的文本行当做单行正文文本识别,显然,这单列文本行和多列文本行是不一样的,因此,这样就容易导致双列注释文本的文本行误判为单列正文文本,从而导致文本图像识别引擎对该列文本的图像的识别准确率较低。

综上,现有技术中在进行复杂排布的文本图像进行识别时,至少存在识别准确率低的问题。

发明内容

本申请实施例提供一种文本定位方法,有助于解决现有技术中文本识别方法存在的准确率低的问题。

第一方面,本申请实施例提供了一种文本定位方法,包括:

获取待识别文本行图像;

将所述待识别文本行图像输入至预先训练的文本行识别模型,确定所述待识别文本行图像对应的文本行识别结果,其中,所述文本行识别结果用于指示所述待识别文本行图像相应位置处的文本行属性;

根据文本行识别结果确定所述待识别文本行图像中与所述文本行属性对应的图像区域。

可选的,所述将所述待识别文本行图像输入至预先训练的文本行识别模型,确定所述待识别文本行图像对应的文本行识别结果的步骤之前,包括:

获取文本行识别模型的训练样本,其中,所述训练样本的样本数据为预设高度和预设宽度的文本行图像,所述训练样本的样本标签用于指示所述文本行图像中相应位置处的文本行属性;

以所述训练样本的样本数据作为所述文本行识别模型的输入,以所述文本行识别模型的输出与所述训练样本的样本标签的误差最小为目标,训练所述文本行识别模型,其中,所述文本行识别模型是基于卷积神经网络构建的。

可选的,获取文本行识别模型的训练样本的步骤,包括:

获取若干预设高度和预设宽度的文本行图像作为样本数据,构建样本数据集合;

对于所述样本数据集合中的每一条样本数据对应的文本行图像,通过按照预设步长移动指定滑窗对所述文本行图像沿图像宽度方向进行扫描,以根据扫描结果标记所述指定滑窗移动过程中顺序经过的各位置处所述文本行图像的文本行属性;

根据标记的所述指定滑窗移动过程中顺序经过的各位置处所述文本行图像的文本行属性,确定相应样本数据的样本标签;其中,所述指定滑窗的高度为所述文本行图像的所述预设高度的第一预设比例,所述指定滑窗的宽度为所述文本行图像的所述预设宽度的第二预设比例。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910105748.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top