[发明专利]知识数据计算系统、方法、服务器及存储介质在审
申请号: | 201711297667.2 | 申请日: | 2017-12-08 |
公开(公告)号: | CN107944012A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 王杰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 数据 计算 系统 方法 服务器 存储 介质 | ||
技术领域
本发明实施例涉及数据处理技术,尤其涉及一种知识数据计算系统、方法、服务器及存储介质。
背景技术
知识图谱(Knowledge Graph,KG)是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体之间通过关系相互联结,构成网状的知识结构。通过知识图谱,可以实现Web从网页链接向概念链接转变,支持用户按主题而不是字符串检索,从而实现真正的语义检索,基于知识图谱的搜索引擎,能够以图形方式向用户反馈结构化的知识,用户不必浏览大量网页,就可以准确定位和深度获取知识。
知识图谱的构建和更新,基于对所抓取的知识数据进行处理,得到符合要求的数据。不同的开发者可能有不同的数据计算需求,目前,开发者需要根据自己的计算需求搭建整套计算架构,开发成本较高。
发明内容
本发明实施例提供一种知识数据计算系统、方法、服务器及存储介质,以提供通用的知识数据计算框架,支持策略开发者自定义的数据处理策略,降低开发成本。
第一方面,本发明实施例提供了一种知识数据计算系统,包括:
数据存储模块,用于存储知识数据和知识图谱;
数据计算模块,用于向开发者提供开发数据处理策略的接口,按照所述开发者自定义的数据处理策略对待处理的知识数据进行计算;
知识图谱更新模块,用于根据处理后的数据更新所述数据存储模块中的知识图谱。
第二方面,本发明实施例还提供了一种知识数据计算方法,基于本发明任意实施例所述的知识数据计算系统实现,包括:
获取待处理的知识数据;
在所述待处理的知识数据对应的计算框架下,按照开发者自定义的数据处理策略对所述待处理的知识数据进行计算,其中所述数据处理策略是所述开发者通过预设接口进行自定义;
根据处理后的数据更新数据存储模块中的知识图谱。
第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的知识数据计算方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的知识数据计算方法。
本发明实施例提供通用的知识数据计算框架,向开发者提供开发数据处理策略的接口,以插件化的方式支持策略开发者自定义数据处理逻辑,同时实现数据存取和计算剥离,开发者无需自己搭建整个架构,只需关注数据处理环节的具体计算逻辑,开发单机程序,节省开发成本且可通过接口方便地更新修改自己的数据处理策略,即该系统支持随机变更的数据处理策略。该系统还支持高量级的数据存储和读写。另外,该系统支持多语言开发数据处理策略,易于进行容器应用部署的横向扩展。通过该系统,开发者能够创建、发布和管理自己的应用实例。
附图说明
图1是本发明实施例一提供的知识数据计算系统的结构示意图;
图2是本发明实施例二提供的知识数据计算系统的结构示意图;
图3是本发明实施例三提供的知识数据计算系统的分层架构示意图;
图4是本发明实施例三提供的Stone批量计算框架的结构示意图;
图5是本发明实施例三提供的知识数据计算的示意图;
图6是本发明实施例四提供的知识数据计算方法的流程图;
图7是本发明实施例五提供的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一提供的知识数据计算系统的结构示意图,本实施例提供了一种通用的知识数据计算框架,可适用于对知识数据进行计算的情况。如图1所示,该系统包括:
数据存储模块100,用于存储知识数据和知识图谱;
数据计算模块200,用于向开发者提供开发数据处理策略的接口,按照所述开发者自定义的数据处理策略对待处理的知识数据进行计算;
知识图谱更新模块300,用于根据处理后的数据更新所述数据存储模块100中的知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711297667.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置