[发明专利]一种表格处理方法和系统在审
申请号: | 202111659254.0 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114328536A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 徐阿龙;陶志伟 | 申请(专利权)人: | 浙江核新同花顺网络信息股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25;G06F16/35;G06K9/62 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 冯娇 |
地址: | 310023 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 表格 处理 方法 系统 | ||
1.一种表格处理方法,其特征在于,所述方法包括:
获取待处理表格;
基于表头检测模型对所述待处理表格进行处理,确定所述待处理表格的行表头和/或列表头;
基于表头分类模型对所述行表头进行处理,确定所述待处理表格中列的分类结果,和/或基于表头分类模型对所述列表头进行处理,确定所述待处理表格中行的分类结果;
基于所述待处理表格中列和/或行的分类结果对所述待处理表格进行抽取,确定第一抽取结果。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
基于文本分类模型对所述待处理表格中单元格的文本进行处理,确定所述单元格的文本中词的类型;
基于所述单元格的文本中词的类型对所述待处理表格进行抽取,确定第二抽取结果。
3.如权利要求1所述的方法,其特征在于,所述获取待处理表格包括:
获取初始表格及其标题;
基于表格分类模型对所述初始表格及其标题中的文本进行处理,确定所述初始表格的分类结果;
当所述初始表格的分类结果满足第一预设条件时,基于所述初始表格确定为所述待处理表格。
4.如权利要求1所述的方法,其特征在于,所述表头检测模型包括行表头检测模型和列表头检测模型,所述基于表头检测模型对所述待处理表格进行处理,确定所述待处理表格的行表头和/或列表头包括:
基于所述行表头检测模型对所述待处理表格中的行进行处理,确定所述待处理表格的所述行表头;和/或
基于所述列表头检测模型对所述待处理表格中的列进行处理,确定所述待处理表格的所述列表头。
5.如权利要求4所述的方法,所述基于所述行表头检测模型对所述待处理表格中的行进行处理,确定所述待处理表格的行表头,包括:
基于行拼接规则,对所述待处理表格中行的单元格进行拼接,得到第一拼接结果;
基于所述行表头检测模型对所述第一拼接结果进行处理,确定所述待处理表格的所述行表头;
所述基于所述列表头检测模型,确定所述待处理表格的列表头,包括:
基于列拼接规则,对所述待处理表格中的列的单元格进行拼接,得到第二拼接结果;
基于所述列表头检测模型对所述第二拼接结果进行处理,确定所述待处理表格的所述列表头。
6.如权利要求5所述的方法,其特征在于,所述表头检测模型包括依次连接的特征嵌入层、第一序列层、第一融合层、第二序列层和第一分类层,其中:
所述特征嵌入层用于基于所述待处理表格中单元格的拼接结果,确定所述待处理表格中单元格的第一特征向量;
所述第一序列层用于基于所述待处理表格中单元格的第一特征向量,确定所述待处理表格中单元格的第二特征向量;
所述第一融合层用于基于所述待处理表格中单元格的第二特征向量,确定所述待处理表格中行或列的第三特征向量;
所述第二序列层用于基于所述待处理表格中行的第三特征向量,确定所述待处理表格中行的第四特征向量,或基于所述待处理表格中列的第三特征向量,确定所述待处理表格中列的第四特征向量;
所述第一分类层用于基于所述待处理表格中行的第四特征向量,确定所述待处理表格的所述行表头,或基于所述待处理表格中列的第四特征向量,确定所述待处理表格的所述列表头。
7.如权利要求6所述的方法,其特征在于,所述第一特征包括所述待处理表格中单元格的位置特征和文本特征。
8.如权利要求1所述的方法,其特征在于,所述表头分类模型包括行表头分类模型和列表头分类模型,所述基于表头分类模型对所述行表头和/或所述列表头进行处理,确定所述待处理表格中列和/或行的分类结果包括:
基于所述行表头分类模型对所述行表头进行处理,确定所述待处理表格中列的分类结果;和/或
基于所述列表头分类模型对所述列表头进行处理,确定所述待处理表格中行的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江核新同花顺网络信息股份有限公司,未经浙江核新同花顺网络信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111659254.0/1.html,转载请声明来源钻瓜专利网。