[发明专利]一种档案自动编研方法有效

申请号：	201410714594.2	申请日：	2014-11-28
公开（公告）号：	CN104361111B	公开（公告）日：	2017-10-27
发明（设计）人：	蒋静;王卓平;门霞;赵毅	申请（专利权）人：	青岛大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	青岛高晓专利事务所(普通合伙)37104	代理人：	张世功
地址：	266071 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种档案自动方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域：

本发明属于档案分类与检索技术领域，涉及一种基于B/S架构档案管理信息系统的档案自动编研方法，为档案汇编和档案文摘汇编提供由计算机软件完成的档案自动编研技术。

背景技术：

基于B/S架构的档案管理信息系统是传统档案馆功能在信息化社会的延伸，既具有传统档案馆的基本属性和功能，又能适应信息时代的发展需要，在实现常规档案数字化管理的同时，通过互联网和建立数字档案存储数据库实现对各部门及各类档案信息的收集、存储、管理和利用，为档案资源的利用提供信息化服务。面向档案利用的档案编研工作是档案馆/室根据档案利用的实际需求，以档案馆/室库藏档案为基础，以汇编档案参考资料为成果形式的一项专门工作。档案编研工作的实质是对档案文件的内容进行研究和加工整理，并编研成册，使之一目了然，以提高执政部门和单位综合管理水平和工作效率，增强档案资源对社会的服务价值。目前，档案编研工作主要是以人工编研为主，其速度慢，效率低，编研质量差。

传统的人工档案编研方法按照对档案的加工层次分为2种，第一种档案编研的加工方法是在原始档案的基础上摘录、缩编和剪辑，形成概要性材料；其加工档案编研的成果形式有：发文汇集、专题汇编、专题档案文摘汇编，其中包括某一领域的专家学者及学术论文文摘汇编、科技成果文摘汇编等等；第二种档案编研的加工方法是需要在对原始档案资料的有关内容进行分析、研究和归纳的基础上，编写出新的材料；其加工档案编研成果形式有：年鉴、组织沿革、史志和综合性技术经济调研报告等。在第二种档案编研的加工成果形式中由于包含了人们对事物的新认识、新观点、新的结论和新的建议等新内容，从信息量的角度来看这些都是新增加的信息，所以这种档案编研加工一般是由相关领域的专家或学者完成。而第一种加工档案编研成果包含的信息是档案中已有的信息，不会增加信息量，不产生新的内容，力求做到“全、精、准”，不能有疏漏，编研的内容要全面、细致，宁多勿漏，并且随着时间的延续，需要编研的原始档案材料积累将会达到海量数据量，对于海量数据由人工进行编研稍有大意就会造成信息遗漏或出错，不能保证档案编研成果的质量和价值，其劳动强度大，工作效率低，编研准确率差，制约了档案资源在海量数据规模和更高技术水平上的充分开发和利用，人力成本很高。

发明内容：

本发明的目的在于克服现有技术存在的缺点，寻求设计提供一种基于档案管理信息系统的档案自动编研方法，采用计算机自动分类和检索技术自动生成档案编研成果形式，提高档案编研效率和准确率，减少人工编研时的信息疏漏。

为了实现上述目的，本发明在基于B/S架构的档案管理信息系统中由档案录入与管理模块和档案编研模块联合实现档案自动编研，其具体步骤为：

(1)先进行档案信息录入，按照系统显示的案卷目录、卷内目录和专家登记卡界面给出的统一格式分别录入档案标题、档案所属分类、档号、年度和专家情况各类基本信息；

(2)再由档案录入与管理模块利用本发明提出的自动层次分类算法自动对步骤(1)录入的档案信息进行分类和汇总，并分别存入相对应的档案目录、卷内目录与专家基本信息登记目录数据库和专家数据库中；

(3)再由档案编研模块根据用户输入的编研条件和存入的信息对相应档案目录、卷内目录与专家基本信息登记目录数据库和专家数据库进行检索、查询并汇总生成档案编研结果；

(4)将档案编研结果显示在屏幕上，或将档案编研结果以Word文档或Excel报表的形式导出后打印输出形成纸质文档保存，实现档案的自动编研。

本发明提出的自动层次分类算法是对现有常规的朴素贝叶斯算法的改进，朴素贝叶斯算法是指分类时考虑文本的所有特征对文本进行分类，分类时将预测样本根据预测结果划分到特定文档类别概率最高的类别库中。

本发明涉及的朴素贝叶斯算法的具体分类模型如下：给定一个未知类别的档案文本X，设有m个类别，记为C1,C2,……,Cm，根据朴素贝叶斯分类定律，在条件X下具有最高后验概率的类别P(Ci|X)的计算公式如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于青岛大学，未经青岛大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410714594.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于共同点击的词条权重确定方法及装置
下一篇：网页打分模型的创建方法及装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种档案自动编研方法有效

专利文献下载