[发明专利]文本数据的定位方法及装置、存储介质、终端有效

专利信息
申请号: 201811633052.7 申请日: 2018-12-29
公开(公告)号: CN109871743B 公开(公告)日: 2021-01-12
发明(设计)人: 刘泉;吴洋;杨宇;陈晨;魏世康;田正中;兰杰;朱兴 申请(专利权)人: 口碑(上海)信息技术有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32
代理公司: 北京中强智尚知识产权代理有限公司 11448 代理人: 黄耀威
地址: 200135 上海市浦东新区民生路11*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 数据 定位 方法 装置 存储 介质 终端
【权利要求书】:

1.一种文本数据的定位方法,其特征在于,包括:

获取基准文本数据的顶点坐标数据,并为所述顶点坐标数据配置边界松弛量,所述边界松弛量用于延伸所述顶点坐标数据中属于所述基准文本数据的行与列的边界值,所述基准文本数据为待定位的文本数据中的任意一个文本数据;

通过配置有边界松弛量的顶点坐标判断目标文本数据与所述基准文本数据是否属于一行、或一列包括:判断所述目标文本数据的列坐标数据是否满足预置边界包含条件,具体包括:判断所述基准文本数据的列坐标数据形成的第一区域是否大于所述目标文本数据的列坐标数据形成的第二区域;若所述第一区域大于所述第二区域,且配置有列松弛量的列坐标数据包含有所述目标文本数据的列坐标数据,则判断所述第一区域与所述第二区域之间的权重值是否大于预设权重值;若所述第一区域小于所述第二区域,且配置有列松弛量的列坐标数据被包含于所述目标文本数据的列坐标数据中,则根据所述第二区域的列坐标数据更新所述配置有列松弛量的列坐标数据,并执行判断所述目标文本数据的列坐标数据是否满足预置边界包含条件的步骤;

若属于一行、或一列,则将所述基准文本数据的定位确定为所述目标文本数据的定位。

2.根据权利要求1所述的方法,其特征在于,所述获取基准文本数据的顶点坐标数据,并为所述顶点坐标数据配置边界松弛量包括:

从全部目标文本数据中选取基准文本数据,并提取所述基准文本数据的顶点坐标数据;

从所述顶点坐标数据中划分出行坐标数据、列坐标数据,并为所述行坐标数据、所述列坐标数据分别配置行边界松弛量、列边界松弛量。

3.根据权利要求2所述的方法,其特征在于,所述预置边界包含条件用于确定所述目标文本数据的列坐标数据与所述配置有列松弛变量的列坐标之间的包含关系;

所述通过配置有边界松弛量的顶点坐标判断目标文本数据与所述基准文本数据是否属于一行、或一列包括:

判断配置有行松弛量的行坐标数据是否包含有所述目标文本数据的行坐标数据。

4.根据权利要求1所述的方法,其特征在于,所述判断所述基准文本数据的列坐标数据形成的第一区域是否大于所述目标文本数据的列坐标数据形成的第二区域之后,所述方法还包括:

若所述第一区域等于所述第二区域,则根据配置有列松弛量的列坐标数据与所述目标文本数据的列坐标数据进行对比,根据对比结果确定是否对所述配置有列松弛量的列坐标数据进行更新,并执行判断所述目标文本数据的列坐标数据是否满足预置边界包含条件的步骤;

若对比结果不同,则根据对比的结果对配置有列松弛量的列坐标数据进行更新;

若对比结果相同,则将所述目标文本数据的列坐标数据确定为满足预置边界包含条件。

5.根据权利要求1所述的方法,其特征在于,所述判断所述第一区域与所述第二区域之间的权重值是否大于预设权重值之后,所述方法还包括:

若所述权重值小于或等于所述预设权重值,则根据所述目标文本数据的列坐标数据对配置有列松弛量的列坐标数据进行更新,并执行判断所述目标文本数据的列坐标数据是否满足预置边界包含条件的步骤;

若所述权重值大于所述预设权重值,则所述目标文本数据的列坐标数据确定为满足预置边界包含条件。

6.根据权利要求3所述的方法,其特征在于,所述若属于一行、或一列,则将所述基准文本数据的定位确定为所述目标文本数据的定位包括:

所述配置有行松弛量的行坐标数据包含有所述目标文本数据的行坐标数据,则将所述目标文本数据的所属行确定为所述基准文本数据的所属行中;或,

所述目标文本数据的列坐标数据满足预置边界包含条件,则将所述目标文本数据的所述列确定为所述基准文本数据的所属列中。

7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

若所述配置有行松弛量的行坐标数据不包含有所述目标文本数据的行坐标数据,或,若所述目标文本数据的列坐标数据不满足预置边界包含条件,则将所述目标文本数据作为其他基准文本数据的目标文本数据,重新执行文本数据的定位方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口碑(上海)信息技术有限公司,未经口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811633052.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top