[发明专利]一种分散文档管理的方法在审
| 申请号: | 202210649073.8 | 申请日: | 2022-06-09 |
| 公开(公告)号: | CN114896618A | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 王晓华 | 申请(专利权)人: | 威海职业学院(威海市技术学院) |
| 主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F16/33;G06F40/216;G06F40/30 |
| 代理公司: | 深圳国联专利代理事务所(特殊普通合伙) 44465 | 代理人: | 杜晓莹 |
| 地址: | 26420*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 分散 文档 管理 方法 | ||
本发明公开一种分散文档管理的方法,包括以下步骤:收集分散文档,添加搜索信息;分散文档存储于云端服务器内;使用倒排索引方法进行词频统计,得到各个词语的词频统计值,获得语义特征;根据语义特征进行分散文档的分类;对分散文档进行重复检测并删除重复文档;对分散文档进行数据的安全加密管理;根据所述搜索信息向存储文档的云端服务器发送安全加密管理信息;文档进行重新编辑以生成新版本的文档,新版本的文档提供给请求用户。有益效果:使得分散文档能够被有序的管理,能够便于用户搜索使用;有效降低云端服务器内存储文档的重复率,有效提高存储文档被检索使用时的效率;有效提高存储文档的安全性;使得分散文档能够被使用者高效管理。
技术领域
本发明涉及文档分布式管理技术领域,具体涉及一种分散文档管理的方法。
背景技术
文档是软件开发使用和维护中的必备资料。软件文档或者源代码文档是指与软件系统及其软件工程过程有关联的文本实体。文档的类型包括软件需求文档,设计文档,测试文档,用户手册等。其中的需求文档,设计文档和测试文档一般是在软件开发过程中由开发者写就的,而用户手册等非过程类文档是由专门的非技术类写作人员写就的。文档能提高软件开发的效率,保证软件的质量,而且在软件的使用过程中有指导、帮助、解惑的作用,尤其在维护工作中,文档是不可或缺的资料。在当今的电子化时代,个人、团体及企业都需要使用可靠而有效的电子文档储存、共享以及管理系统。电子文档存储和管理方案主要体现于个人本地存储,共享网络硬盘,个人或企业团体云盘存储,以及使用基于内网和外网专业文档管理系统几个方面。这些分散文档在实际使用中,重复率较高,使用效率低,同时,难以搜索,安全性不高,难以高效管理。
发明内容
为全面解决上述问题,尤其是针对现有技术所存在的不足,本发明提供了一种分散文档管理的方法能够全面解决上述问题。
为实现上述目的,本发明采用以下技术手段:
一种分散文档管理的方法,包括以下步骤:
第一步、收集分散文档,并在分散文档中添加搜索信息;
第二步、把添加搜索信息的分散文档存储于云端服务器内;
第三步、识别所述搜索信息的文本内容,使用倒排索引方法进行词频统计,得到各个词语的词频统计值,获得语义特征;
第四步、根据语义特征进行分散文档的分类;
第五步、对分类好的分散文档进行重复检测并删除重复文档;
第六步、对检测完成的分散文档进行数据的安全加密管理;
第七步、用户通过云端服务器查询所述分散文档的搜索信息,根据所述搜索信息向存储文档的云端服务器发送安全加密管理信息;
第八步、存储文档的云端服务器接收到所述全加密管理信息之后对所述文档进行重新编辑以生成新版本的文档,所述新版本的文档提供给请求用户。
本发明进一步的优选方案:所述第一步中搜索信息包括类别、关键字信息、名称、编号和编码。
本发明进一步的优选方案:所述第四步的具体步骤如下:
通过从第二步中存储的数据采样多个文档,抽取该多个文档作为分类对象;
从存储部抽取第三步的语义特征;
基于语义特征与分类对象内的类别信息出现的频率的相似性,对分类对象进行聚类,由此,按照每个语义特征生成所述类目。
本发明进一步的优选方案:所述第五步中的具体步骤如下:
获取全部已入库文档和待检测文档;
从存储部抽取分词处理全部已入库文档和所述待检测文档;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威海职业学院(威海市技术学院),未经威海职业学院(威海市技术学院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210649073.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型防雨水的通气换风装置
- 下一篇:滚台输送机





