[发明专利]自动化存储以及知识图谱生成方法及装置在审
| 申请号: | 202010066045.4 | 申请日: | 2020-01-20 |
| 公开(公告)号: | CN111291194A | 公开(公告)日: | 2020-06-16 |
| 发明(设计)人: | 孙强强;潘小康 | 申请(专利权)人: | 深圳供电局有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/31 |
| 代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 王震宇 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自动化 存储 以及 知识 图谱 生成 方法 装置 | ||
一种自动化存储以及知识图谱生成方法及装置,该方法包括:进行图库建模,对信息数据进行实体、关系、属性的关联提取,并针对已提取的实体及其关系进行知识创建,生成实体和关系展示图,即知识图谱,其中包含所有数据之间存在的关联关系,并以所述知识图谱将所述信息数据存储于存储系统。本发明可以支持海量数据知识化存储、快速检索的功能,实现价值数据的积累并对智能引擎决策基础平台起到很好的支撑作用。通过海量信息数据中的关系提取和知识图谱的生成,可实现对网络资产知识库数据的深度关联,并形成为新的知识,为之后的知识计算、知识推理发挥更快捷、高效的作用。
技术领域
本发明涉及数据治理,特别是一种自动化存储以及知识图谱生成方法及装置。
背景技术
知识图谱的内容包含实体、关系及属性,如图1所示。实体就是对客观个体的抽象描述,比如一个人,一部电影、一句话、一个邮箱。人的姓名、性别等是属于这个人物实体的属性。实体的关系是实体与实体直接关系的抽象。如某个邮箱的归属者是张三,那么两者的关系是拥有关系。简单的说,知识图谱就是具有属性的实体,通过关系连接而成的网状知识库。数学模型属于“有向图”。现有的知识图谱的构建过程包括本体建模、知识抽取、知识融合、知识存储、知识推理这几个步骤。现有方法所构建的知识图谱的质量以及数据治理的便利性、数据安全性等方面仍有待提升。
发明内容
本发明的主要目的在于克服上述缺陷中的至少一种,提供一种自动化存储以及知识图谱生成方法及装置。
为实现上述目的,本发明采用以下技术方案:
一种自动化存储以及知识图谱生成方法,包括:进行图库建模,对信息数据进行实体、关系、属性的关联提取,并针对已提取的实体及其关系进行知识创建,生成实体和关系展示图,即知识图谱,其中包含所有数据之间存在的关联关系,并以所述知识图谱将所述信息数据存储于存储系统。
进一步地:
针对提取的信息数据所属的应用场景来生成实体和关系展示图。
通过调用批量存储接口进行数据存储。
响应知识图谱的存储请求,通过信息数据的解析获取实体类型,定位需存储的实体类型,根据所述实体类型将信息数据转换成所述知识图谱存储需要的格式,进行存储操作。
存储先缓存在内存中,并定时调用持久化存储。
对存储的数据文件进行多副本备份。
针对已提取的实体及关系进行知识创建,并生成新的实体,通过客户端展示关系图。
在客户端展示时,根据数据相互之间的关联关系来抽取相应的数据以进行展示,包括展示数据之间的关系以及整个数据内容之间的共同点以及不同点,或以完整的关系图展示。
一种自动化存储以及知识图谱生成装置,用于实施所述的自动化存储以及知识图谱生成方法,所述装置包括本体建模模块、知识抽取模块、知识融合模块、自动化去重存储模块、知识推理模块以及关系图生成展示模块,各模块的功能独立实现;所述装置根据不同的应用场景,通过分析建立相应的模型数据,保证知识图谱的空间独立。
在构建行业知识图谱的本体模型时,通过数据维度建模分析来引导构建本体模型,通过精细化处理数据、关联关系抽取、共同交叉点推理、维度关系计算得到新的实体或知识。
本发明具有如下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010066045.4/2.html,转载请声明来源钻瓜专利网。





