[发明专利]一种基于wikidata的知识体系自动构建方法与系统有效

专利信息
申请号: 201911356255.0 申请日: 2019-12-25
公开(公告)号: CN111177406B 公开(公告)日: 2023-09-26
发明(设计)人: 毛彬;罗威;谭玉珊;罗准辰;田昌海;叶宇铭;宋宇 申请(专利权)人: 中国人民解放军军事科学院军事科学信息研究中心
主分类号: G06F16/36 分类号: G06F16/36
代理公司: 北京方安思达知识产权代理有限公司 11472 代理人: 陈琳琳;刘振
地址: 100142*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 wikidata 知识 体系 自动 构建 方法 系统
【说明书】:

发明公开了一种基于wikidata的知识体系自动构建方法与系统,所述方法包括:步骤1)获取种子数据和辐射层级;步骤2)抽取与种子数据相关的wikidata知识条目;步骤3)对wikidata知识条目清洗解析,以主‑谓‑宾三元组的形式存储,并拆分、解析生成知识结构数据,同时根据解析出的关联实体形成辐射实体,生成新的种子数据;若迭代次数未达到辐射层级,进入步骤2),否则,进入步骤4);步骤4)将知识结构数据进行封装,确定知识模型层级、属性关系和知识实体,将wikidata知识条目对应到知识实体下,形成知识体系。本发明提出的适用于特定主题/知识实体的知识体系构建方法,为快速掌握、后续深入优化完善知识体系及深入研究该主题/知识实体奠定了基础。

技术领域

本发明涉及知识体系构建领域,尤其是涉及一种基于wikidata的知识体系自动构建方法和系统。

背景技术

在大数据时代背景下,面对浩如烟海的信息/知识和快速更新的现状,通过传统的知识体系积累方式,大量人工将花费在数据搜集和整理上,对于科研和情报人员的研究价值更是一种极大的浪费。采取机器智能手段挖掘已有的公共开放知识库,自动汇聚特定主题/知识主体的知识,形成一套基础的知识体系,从而让科研和情报人员能够快速了解掌握其框架轮廓,并结合自身认知进行进一步的修正完善,演变成特定的知识体系。

Wikidata是一个世界范围的免费开放、多语言、任何人或机器都可以编辑修改的大规模链接知识库,采用众包协作机制支持以三元组为基础的知识条目的自由编辑。Wikidata中的每个实体存在多个不同语言的标签,别名,描述,以及声明(statement),目前支持超过350种语言,拥有超过6600万个数据项及8亿的声明,是一个超大型知识库。

概念介绍

知识条目,是指包含了一定知识内容的陈述,由人总结提炼出来的事实、描述或者方法理论,具有明确的主谓宾结构,可以是一条简单的陈述句,也可以多条信息的复合句。

知识实体,是指能够从任意描述中分离出来的主语对象,包含世间万物,大到国家宇宙,小到概念。如“‘她’是指称女性的代词”中的‘她’,“牛顿第一运动定律:任何物体都要保持匀速直线运动或静止状态,直到外力迫使它改变运动状态为止。”的“牛顿第一定律”。

属性/关系,是指定性或者定量刻画知识实体的某个方面的一个度量,其中属性是知识实体的绝对度量,关系是知识实体的相对度量,它们的区别在于是否依赖于另一个实体的定义,如“性别”、“身高”、“体重”是属性,“首都”、“朋友”、“父母”是关系。

知识模型,也称知识类别,是指一类实体的统称,并具有统一的属性、关系定义。比如人员、机构。

知识模型层级,即知识实体的类别体系,具有树状层级关系。

辐射,是指一个主题/知识实体往外延伸,根据关系关联的知识实体一层层往外扩张。

Wikidata作为一个开放知识库,是面向通用领域、所有用户的使用需求,不能定制化呈现特定主题/知识实体的知识体系。

发明内容

本发明的目的在于克服上述技术缺陷,提出了一种基于wikidata的知识体系自动构建方法与系统。

为实现上述目的,本发明提出了一种基于wikidata的知识体系自动构建方法,所述方法包括:

步骤1)获取种子数据和辐射层级;

步骤2)抽取与种子数据相关的wikidata知识条目;

步骤3)对wikidata知识条目清洗解析,以主-谓-宾三元组的形式存储,并拆分、解析生成知识结构数据,同时根据解析出的关联实体形成辐射实体,生成新的种子数据;若迭代次数未达到辐射层级,进入步骤2),否则,进入步骤4);

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院军事科学信息研究中心,未经中国人民解放军军事科学院军事科学信息研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911356255.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top