[发明专利]基于分布式系统对电子表格进行分类的方法和系统及介质有效
申请号: | 202210413217.X | 申请日: | 2022-04-20 |
公开(公告)号: | CN114510912B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 杨胜;黄瑛;袁平;曾海波;唐必成 | 申请(专利权)人: | 佳瑛科技有限公司 |
主分类号: | G06F40/174 | 分类号: | G06F40/174;G06F40/18;G06K9/62 |
代理公司: | 长沙楚为知识产权代理事务所(普通合伙) 43217 | 代理人: | 李大为 |
地址: | 410000 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分布式 系统 电子表格 进行 分类 方法 介质 | ||
本发明公开了一种基于分布式系统对电子表格进行分类的方法和系统及介质,其方法包括:接收分布式系统上各个用户端所发送的电子表格;将任务列表中的各个电子表格进行过滤处理;解析过滤处理后的电子表格的表达结构;将样本数据集中的每一个样本数据转换成所对应的样本结构;对所述电子表格的表达结构和样本数据集所形成的样本结构集进行相似度匹配;基于第一样本结构解析出所述电子表格在样本结构集中所对应的样本数据;将各个电子表格中的每一电子表格分发到所对应样本数据所关联的电子表格分类库。本发明实施例可以对无效电子表格进行去冗余处理,以及针对电子表格内容进行快速有效的分类,对不同终端所提交的电子表格进行有效管理。
技术领域
本发明涉及文档存储技术领域,尤其涉及一种基于分布式系统对电子表格进行分类的方法和系统及介质。
背景技术
电子表格是一类模拟纸上计算表格的计算机程序,它会显示由一系列行与列构成的网格。其单元格内可以存放数值、计算式、或文本。电子表格通常用于财务信息,因为它能够频繁的重新计算整个表格。电子版表格可以输入输出、显示数据,也可利用公式计算一些简单的加减法,可以帮助用户制作各种复杂的表格文档,进行繁琐的数据计算,并能对输入的数据进行各种复杂统计运算后显示为可视性极佳的表格,同时它还能形象地将大量枯燥无味的数据变为多种漂亮的彩色商业图表显示出来,极大地增强了数据的可视性。另外,电子版表格还能将各种统计报告和统计图打印出来。 EXCEL是微软OFFICE软件中的电子版表格组件,其做出的表格是电子版表格中的一种,除此以外还有国产的CCED、金山WPS中的电子表格等。
电子表格在公司业务管理方面涉及到不同的应用,其所涉及到不同业务层的管理和分配,导致面对不同终端数据存储形式下,管理服务器会面临冗余在存储空间的电子表格,其无法有效针对不同电子表格按照电子表格的内容建立分类匹配,以及去除冗余电子表格。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于分布式系统对电子表格进行分类的方法和系统及介质,其可以对无效电子表格进行去冗余处理,以及针对电子表格内容进行快速有效的分类,对不同终端所提交的电子表格进行有效管理。
为了解决上述问题,本发明提出了一种基于分布式系统对电子表格进行分类的方法,所述方法包括:
接收分布式系统上各个用户端所发送的电子表格,并将各个用户端所发送的电子表格存储到任务列表中;
将任务列表中的各个电子表格进行过滤处理,去除无效电子表格;
解析过滤处理后的电子表格的表达结构,所述表达结构采用树形结构表示法;
获取样本数据集,将样本数据集中的每一个样本数据转换成所对应的样本结构,所述样本结构采用树形结构表示法;
对所述电子表格的表达结构和样本数据集所形成的样本结构集进行相似度匹配,获取所述电子表格的表达结构所对应的第一样本结构;
基于第一样本结构解析出所述电子表格在样本结构集中所对应的样本数据;
基于所述样本结构集中所对应的样本数据取所关联的电子表格分类库;
将各个电子表格中的每一电子表格分发到所对应样本数据所关联的分类库。
所述将任务列表中的各个电子表格进行过滤处理,去除无效电子表格包括:
基于用户环境建立针对电子表格的过滤库,所述过滤库中设置有各个无效电子表格的文本库;
基于过滤库对任务列表中的各个电子表格进行过滤处理,去除无效电子表格。
所述基于用户环境建立针对电子表格的过滤库包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳瑛科技有限公司,未经佳瑛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210413217.X/2.html,转载请声明来源钻瓜专利网。