[发明专利]档案编目数据处理方法、装置、计算设备及存储介质在审
申请号: | 202011442640.X | 申请日: | 2020-12-08 |
公开(公告)号: | CN112463896A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 常兰会;周志勤 | 申请(专利权)人: | 常兰会 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/245 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 芦玲玲 |
地址: | 530021 广西壮族自治区南宁市荔滨大道*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 档案 编目 数据处理 方法 装置 计算 设备 存储 介质 | ||
本发明公开了一种档案编目数据处理方法、装置、计算设备及存储介质。本方案能够将以第一模式记录的档案编目数据转换为以第二模式记录的档案编目数据,实现档案编目模式的自动转换,从而提升档案编目模式的转换效率,降低转换成本,保障转换精准度,并且本方案简单易行,适于大规模应用与实施。
技术领域
本发明涉及数据处理技术领域,具体涉及一种档案编目数据处理方法、装置、计算设备及存储介质。
背景技术
档案编目是指档案馆(室)对档案进行著录、标引和组织、制作目录等。目前,随着科技及社会的发展,档案编目数据通常以电子表格等方式呈现。
然而,由于不同机构其档案编目标准不同,即使同一机构其档案编目模式也存在多种,例如同一机构中通常会采用卷内文件目录模式、案卷目录模式以及在编制文书、实物、录音录像等所采用的“组件”模式等等。
目前,当档案编目发生转换时,通常需由人工将数据逐条逐项录入或导入,且都需要逐条逐项核对。然而,采用该种方法其效率低下,人工成本高,而且其录入错误率高,更不适于大规模应用与实施。
发明内容
为解决上述问题,本发明提出了一种档案编目数据处理方法、装置、计算设备及存储介质。
第一个方面,本发明提供了一种档案编目数据处理方法,包括:
响应于用户的模式转换操作,获取以第一模式记录的档案编目数据;
将第一模式中的属性项与第二模式中的属性项进行匹配,根据匹配结果确定第二模式中的第一类属性项以及第二类属性项;其中,第二模式中与第一模式相同的属性项为第一类属性项,第二模式中与第一模式不同的属性项为第二类属性项;
针对于任一第一类属性项,将第一模式中该第一类属性项的属性值赋值于第二模式中该第一类属性项;
针对于任一第二类属性项,基于预设映射表,从第一模式的属性项中查找出与该第二类属性项关联的属性项,根据第一模式中所述关联的属性项的属性值以及该第二类属性项与所述关联的属性项的关联关系,计算该第二类属性项的属性值。
可选的,所述预设映射表中存储有不同属性项之间的关联关系。
可选的,所述方法还包括:获取预设标准库中的档案编目标准数据;
对所述档案编目标准数据进行语义识别,以识别出档案编目标准数据中的命名实体;
根据命名实体之间的连接词语义,识别命名实体间的关联关系;
根据所述命名实体以及所述命名实体间的关联关系,生成包含不同属性项之间的关联关系的预设映射表。
可选的,所述方法还包括:获取预设标注库中新写入的档案编目标准数据;
将所述新写入的档案编目标准数据输入至预先训练好的属性关系识别模型中;
获取所述属性关系识别模型输出的包含不同属性项之间的关联关系的预设映射表。
可选的,所述方法还包括:监测预设标准库中的数据变更操作,根据所述数据变更操作更新所述预设映射表。
可选的,所述属性项包括以下项中的至少一种:
档号、序号、文件编号、题名、责任者、日期、页数、备注、全宗号、属类代码、实体分类名称、项目号、项目名称、案卷号、保管期限、以及分类号。
可选的,在获取以第一模式记录的档案编目数据之后,所述方法还包括:
对所述档案编目数据进行校验,判断所述档案编目数据中是否存在无效数据;
若是,则生成相应的反馈信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常兰会,未经常兰会许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011442640.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴向磁场电机及其冷却流道结构
- 下一篇:一种光缆自动退缆排线设备