[发明专利]二维表格识别方法、装置、设备及系统在审
| 申请号: | 202011581859.8 | 申请日: | 2020-12-28 |
| 公开(公告)号: | CN112597927A | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 田丹;银虹宇 | 申请(专利权)人: | 电子科技大学;成都精准云科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F40/166 |
| 代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 涂凤琴 |
| 地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 二维 表格 识别 方法 装置 设备 系统 | ||
1.一种二维表格的识别方法,其特征在于,包括:
获取待识别表格;
基于预先配置的识别参数,对所述待识别表格进行识别,得到所述待识别表格与目标表格的表头匹配结果和表内对应关系;
根据所述表头匹配结果和所述表内对应关系,从所述待识别表格中获取到所述目标表格的内容并存储。
2.根据权利要求1所述的二维表格的识别方法,其特征在于,所述识别参数包括目标字段和有效关联阈值。
3.根据权利要求2所述的二维表格的识别方法,其特征在于,所述基于预先配置的识别参数,对所述待识别表格进行识别,包括:
获取所述待识别表格的第一行与第一列,根据所述目标字段和所述有效关联阈值,从所述第一行和所述第一列中确定与所述目标字段为对应关系的字段;
通过与所述目标字段为对应关系的字段,确定所述第一行中与所述目标字段为对应关系的字段的第一数量,以及,确定所述第一列中与所述目标字段为对应关系的字段的第二数量;
通过所述第一数量和所述第二数量,确定所述表头匹配结果;
根据确定的所述表头匹配结果和表头中与所述目标字段为对应关系的字段,得到表内对应关系。
4.根据权利要求3所述的二维表格的识别方法,其特征在于,所述根据所述目标字段和所述有效关联阈值,从所述第一行和所述第一列中确定与所述目标字段为对应关系的字段,包括:
针对所述第一行和所述第一列中的各个字段,执行如下操作:计算当前字段与所述目标字段的关联值;根据所述关联值和所述有效关联阈值,判断当前字段与所述目标字段是否匹配;若当前字段与所述目标字段匹配,则当前字段与所述目标字段为对应关系。
5.根据权利要求4所述的二维表格的识别方法,其特征在于,所述识别参数还包括所述目标字段的同义字段;
所述计算当前字段与所述目标字段的关联值,包括:
若当前字段与所述目标字段相同,或者,当前字段与所述目标字段的同义字段相同,则确定所述关联值为10;
反之,计算当前字段与所述目标字段的文本关联度;判断所述文本关联度是否大于预设百分比;若所述文本关联度大于预设百分比,将所述文本关联度乘以10得到文本关联值,对所述文本关联值进行四舍五入处理,得到所述关联值。
6.根据权利要求5所述的二维表格的识别方法,其特征在于,所述判断所述文本关联度是否大于预设百分比之后,所述方法还包括:
若所述文本关联度小于等于预设百分比,则确定所述关联值为0。
7.根据权利要求4所述的二维表格的识别方法,其特征在于,所述根据所述关联值和所述有效关联阈值,判断当前字段与所述目标字段是否匹配,包括:
判断所述关联值与所述有效关联阈值的大小;
若所述关联值大于等于所述有效关联阈值,则当前字段与所述目标字段匹配;若所述关联值小于所述有效关联阈值,则当前字段与所述目标字段不匹配。
8.根据权利要求3所述的二维表格的识别方法,其特征在于,所述通过所述第一数量和所述第二数量,确定所述表头匹配结果,包括:
判断所述第一数量与所述第二数量的大小;
若所述第一数量大于所述第二数量,则所述表头匹配结果为所述第一行为表头;若所述第一数量小于所述第二数量,则所述表头匹配结果为所述第一列为表头。
9.一种二维表格的识别装置,其特征在于,包括:
第一获取模块,用于获取待识别表格;
识别模块,用于基于预先配置的识别参数,对所述待识别表格进行识别,得到所述待识别表格与目标表格的表头匹配结果和表内对应关系;
第二获取模块,用于根据所述表头匹配结果和所述表内对应关系,从所述待识别表格中获取到所述目标表格的内容并存储。
10.一种二维表格的识别设备,其特征在于,包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序;
所述处理器用于调用并执行所述存储器中的所述计算机程序,以执行如权利要求1-8任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学;成都精准云科技有限公司,未经电子科技大学;成都精准云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011581859.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使用消息总线接口的PHY重新校准
- 下一篇:配光元件、配光模组及光源模块





