[发明专利]文本数据的定位方法及装置、存储介质、终端有效
| 申请号: | 201811633052.7 | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN109871743B | 公开(公告)日: | 2021-01-12 |
| 发明(设计)人: | 刘泉;吴洋;杨宇;陈晨;魏世康;田正中;兰杰;朱兴 | 申请(专利权)人: | 口碑(上海)信息技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 200135 上海市浦东新区民生路11*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 数据 定位 方法 装置 存储 介质 终端 | ||
1.一种文本数据的定位方法,其特征在于,包括:
获取基准文本数据的顶点坐标数据,并为所述顶点坐标数据配置边界松弛量,所述边界松弛量用于延伸所述顶点坐标数据中属于所述基准文本数据的行与列的边界值,所述基准文本数据为待定位的文本数据中的任意一个文本数据;
通过配置有边界松弛量的顶点坐标判断目标文本数据与所述基准文本数据是否属于一行、或一列包括:判断所述目标文本数据的列坐标数据是否满足预置边界包含条件,具体包括:判断所述基准文本数据的列坐标数据形成的第一区域是否大于所述目标文本数据的列坐标数据形成的第二区域;若所述第一区域大于所述第二区域,且配置有列松弛量的列坐标数据包含有所述目标文本数据的列坐标数据,则判断所述第一区域与所述第二区域之间的权重值是否大于预设权重值;若所述第一区域小于所述第二区域,且配置有列松弛量的列坐标数据被包含于所述目标文本数据的列坐标数据中,则根据所述第二区域的列坐标数据更新所述配置有列松弛量的列坐标数据,并执行判断所述目标文本数据的列坐标数据是否满足预置边界包含条件的步骤;
若属于一行、或一列,则将所述基准文本数据的定位确定为所述目标文本数据的定位。
2.根据权利要求1所述的方法,其特征在于,所述获取基准文本数据的顶点坐标数据,并为所述顶点坐标数据配置边界松弛量包括:
从全部目标文本数据中选取基准文本数据,并提取所述基准文本数据的顶点坐标数据;
从所述顶点坐标数据中划分出行坐标数据、列坐标数据,并为所述行坐标数据、所述列坐标数据分别配置行边界松弛量、列边界松弛量。
3.根据权利要求2所述的方法,其特征在于,所述预置边界包含条件用于确定所述目标文本数据的列坐标数据与所述配置有列松弛变量的列坐标之间的包含关系;
所述通过配置有边界松弛量的顶点坐标判断目标文本数据与所述基准文本数据是否属于一行、或一列包括:
判断配置有行松弛量的行坐标数据是否包含有所述目标文本数据的行坐标数据。
4.根据权利要求1所述的方法,其特征在于,所述判断所述基准文本数据的列坐标数据形成的第一区域是否大于所述目标文本数据的列坐标数据形成的第二区域之后,所述方法还包括:
若所述第一区域等于所述第二区域,则根据配置有列松弛量的列坐标数据与所述目标文本数据的列坐标数据进行对比,根据对比结果确定是否对所述配置有列松弛量的列坐标数据进行更新,并执行判断所述目标文本数据的列坐标数据是否满足预置边界包含条件的步骤;
若对比结果不同,则根据对比的结果对配置有列松弛量的列坐标数据进行更新;
若对比结果相同,则将所述目标文本数据的列坐标数据确定为满足预置边界包含条件。
5.根据权利要求1所述的方法,其特征在于,所述判断所述第一区域与所述第二区域之间的权重值是否大于预设权重值之后,所述方法还包括:
若所述权重值小于或等于所述预设权重值,则根据所述目标文本数据的列坐标数据对配置有列松弛量的列坐标数据进行更新,并执行判断所述目标文本数据的列坐标数据是否满足预置边界包含条件的步骤;
若所述权重值大于所述预设权重值,则所述目标文本数据的列坐标数据确定为满足预置边界包含条件。
6.根据权利要求3所述的方法,其特征在于,所述若属于一行、或一列,则将所述基准文本数据的定位确定为所述目标文本数据的定位包括:
所述配置有行松弛量的行坐标数据包含有所述目标文本数据的行坐标数据,则将所述目标文本数据的所属行确定为所述基准文本数据的所属行中;或,
所述目标文本数据的列坐标数据满足预置边界包含条件,则将所述目标文本数据的所述列确定为所述基准文本数据的所属列中。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若所述配置有行松弛量的行坐标数据不包含有所述目标文本数据的行坐标数据,或,若所述目标文本数据的列坐标数据不满足预置边界包含条件,则将所述目标文本数据作为其他基准文本数据的目标文本数据,重新执行文本数据的定位方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口碑(上海)信息技术有限公司,未经口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811633052.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





