[发明专利]一种图数据库更新方法及装置在审
申请号: | 202110701445.2 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113326276A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 王得贤;李长亮 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/28 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 更新 方法 装置 | ||
本申请提供一种图数据库更新方法及装置,其中所述图数据库更新方法包括:监控数据源,从所述数据源中获取变更源数据;基于原图数据库的本体结构从所述变更源数据中确定与所述原图数据库对应的变更数据;根据所述原图数据库的本体结构及所述原图数据库的本体结构对应的数据导入规则处理所述变更数据,获得待导入图数据;将所述待导入图数据导入至所述原图数据库获得新图数据库。本申请的图数据库更新方法,根据图数据库的本体结构及数据导入规则将结构化数据映射为图数据,并对导入图数据库的数据进行检查,从而提高图数据库更新准确性以及更新效率。
技术领域
本申请涉及互联网技术领域,特别涉及一种图数据库更新方法、装置、计算设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,使用互联网的用户数量也随之增多,相应的,为了存储用户的各种数据,对于数据库技术的需求也越来越大。
若要保存大量的用户信息并使用户信息以知识图谱的方式进行存储,可以使用图数据库来解决该问题。在知识图谱的使用过程中,对于实时数据,往往伴随着数据源(一般为结构化数据)的变化,保证图数据库与结构化数据库中的数据同步是知识图谱使用的重要需求。目前实现信息同步的方法一般有两种,第一:使用人工同步,利用人力将结构化数据的变化更新至图数据库中,但使用人工同步会存在准确性差、实时性差的问题,并且人工成本较高,无法维护大规模的图数据库,也无法应对高频率更新的数据。第二:基于Binlog的同步方法,即根据结构化数据库的数据变化行为直接更新图数据库中的数据,但基于Binlog的同步方法无法实现有效的数据映射,对于更新数据,在数据结构及内容上没有完善的检查方法和过程,并且无法自动解决更新行为和知识图谱中现有数据存在的数据矛盾。
发明内容
有鉴于此,本申请实施例提供了一种图数据库更新方法、装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种图数据库更新方法,包括:
监控数据源,从所述数据源中获取变更源数据;
基于原图数据库的本体结构,从所述变更源数据中确定与所述原图数据库对应的变更数据;
根据所述原图数据库的本体结构及所述原图数据库的本体结构对应的数据导入规则处理所述变更数据,获得待导入图数据;
将所述待导入图数据导入至所述原图数据库获得新图数据库。。
根据本说明书实施例的第二方面,提供了一种图数据库更新装置,包括:
获取模块,被配置为监控数据源,从所述数据源中获取变更源数据;
确定模块,被配置为基于原图数据库的本体结构,从所述变更源数据中确定与所述原图数据库对应的变更数据;
映射模块,被配置为根据所述原图数据库的本体结构及所述原图数据库的本体结构对应的数据导入规则处理所述变更数据,获得待导入图数据;
导入模块,被配置为将所述待导入图数据导入至所述原图数据库获得新图数据库。
根据本说明书实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现所述图数据库更新方法的步骤。
根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述图数据库更新方法的步骤。
根据本申请实施例的第五方面,提供了一种芯片,其存储有计算机指令,该指令被芯片执行时实现所述图数据库更新方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110701445.2/2.html,转载请声明来源钻瓜专利网。