[发明专利]一种基于知识图谱的档案管理模型构建方法及系统有效

专利信息
申请号: 202010600107.5 申请日: 2020-06-28
公开(公告)号: CN111737471B 公开(公告)日: 2023-10-13
发明(设计)人: 雷洁;赵瑞雪;鲜国建;寇远涛;侯希闻;仲晓春;刘杉;许怡然;程思梦 申请(专利权)人: 中国农业科学院农业信息研究所
主分类号: G06F16/35 分类号: G06F16/35;G06F40/279;G06F40/30;G06N5/04
代理公司: 北京三聚阳光知识产权代理有限公司 11250 代理人: 刘静
地址: 100081 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 图谱 档案 管理 模型 构建 方法 系统
【说明书】:

发明公开了一种基于知识图谱的档案管理模型构建方法及系统,方法包括:获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型;根据动态档案多维度关联模型,通过编辑工具、建模语言建立计算机可识别的档案知识图谱语义模型,利用档案知识对齐、知识消歧对档案自身知识进行知识融合,并与档案知识组织模型互相映射,通过知识推理过程对语义关联进行知识更新与替代。本发明提出了通过识别最小的知识单元识别、建立多维度关联模型及知识融合技术,提高档案语义关联度与利用率。

技术领域

本发明涉及信息资源管理技术领域,具体涉及一种基于知识图谱的档案管理模型构建方法及系统。

背景技术

档案作为机构的重要资源,其价值绝不仅仅在于保存历史资料作为参考凭证,指导未来科学研究工作与提供决策支撑更为重要,随着数字档案急剧增加,大数据、云计算、语义网等信息技术正在推动档案管理方法的创新。在大数据时代,数据已成为基础性战略资源,在数据密集型科学研究范式下,信息的多样化多源化海量化使得档案科研人员必须花费大量的时间检索大量的基础文献资源获取档案科研思路,只有有效挖掘与发现档案资源间的关联,才能产出高质量的档案知识,打通档案科研人员获取档案科研数据、档案科研方法的通道,整合档案知识,梳理各类资源间关联关系,挖掘各类资源的重要关联信息,将档案的科研项目、科研人员、科研成果与研究报告、技术思路等档案资源连接。

当前正快速步入智能时代,知识图谱在各领域快速发展并实现了场景式应用,为档案管理领域开展知识图谱研究奠定了基础,语义技术的发展对于档案管理效率的提高以及档案服务空间的拓展有着重要影响,语义技术存在档案关联与利用方面存在着档案完整性缺失、档案资源组织关联方式单一、档案资源融合与利用率低等缺陷。

发明内容

因此,本发明提供的一种基于知识图谱的档案管理模型构建方法及系统,克服了现有技术中档案语义关联与利用率低的缺陷。

为达到上述目的,本发明提供如下技术方案:

第一方面,本发明实施例提供一种基于知识图谱的档案管理模型构建方法,包括:

获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系;

基于各知识单元间的语义联系,通过知识图谱建立动态档案多维度关联模型;

根据动态档案多维度关联模型,通过编辑工具、建模语言建立计算机可识别的档案知识图谱语义模型,利用档案知识对齐、知识消歧对档案自身知识进行知识融合,并与档案知识组织模型互相映射,通过知识推理过程对语义关联进行知识更新与替代。

在一实施例中,还包括:档案文本还与外部知识库建立关联,扩展档案的语义关系。

在一实施例中,所述获取计算机可读格式的档案文本,识别档案文本中最小的知识单元,基于各个最小的知识单元的相关关系,形成各知识单元间的语义联系的步骤,包括:

分析档案文本的类型,根据不同类型档案文本的数据结构,采用不同的方法对档案文本进行解析;

在解析的基础上利用预设档案元数据架构以及档案知识层级构建识别档案文本中的最小知识单元;

利用预设实体识别方法及自然语言处理方法对最小知识单元进行抽取,所述最小知识单元为实体;

利用最小知识单元,建立与其他知识单元的语义联系。

在一实施例中,在解析的基础上利用预设实体识别方法及自然语言处理方法对档案文本中的最小知识单元进行抽取,所述最小知识单元为实体的步骤,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业信息研究所,未经中国农业科学院农业信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010600107.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top