[发明专利]一种基于众包的知识图谱构建方法及系统有效
申请号: | 201911399693.5 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111159427B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 涂志莹;刘星焜;王忠杰;徐晓飞 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 高媛 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 图谱 构建 方法 系统 | ||
1.一种基于众包的知识图谱构建方法,其特征在于所述方法包括如下步骤:
步骤S1、创建图空间:
所述图空间为面向用户应用的命名空间,包含一个图数据库容器、一个RDF数据库和一个或多个Trans模型;
步骤S2、创建用户模式并进行模式匹配和融合:
创建用户模式,描述实体类、属性和关系;将用户模式存入步骤S1中创建的图空间所对应的RDF数据库;将用户模式和系统默认模式进行匹配和融合,生成模式匹配表,存入数据库,具体步骤如下:
步骤S21、在前端新建用户模式,定义实体类,定义类继承关系,定义类属性,定义类属性取值范围,定义关系,定义关系取值范围,定义完成后保存提交,用户模式将保存到RDF数据库中;
步骤S22、模式匹配:
步骤S21所述用户模式O1与系统默认模式O2进行匹配,输出为模式匹配表T,匹配表项为模式中定义的类、属性或关系;匹配方法结合文本相似性算法和结构相似性算法,计算用户模式O1中每一项与系统默认模式O2中每一项的文本和结构相似性,将两种相似性组合后得到相似性值,若大于阈值,则认为对应项是匹配的,加入模式匹配表T中;
步骤S23、模式融合:
输入为步骤S21所述用户模式O1、步骤S22所述系统默认模式O2与步骤S22所述模式匹配表T,输出为新的默认模式NewO2;
根据模式匹配表T,将用户模式O1与系统默认模式O2连接,若模式匹配表T中的匹配项为1:null,即用户模式O1中的实体在系统默认模式O2中不存在,为系统默认模式O2创建相同的实体;若模式匹配表T中的匹配项为1:1,则跳过;
根据模式匹配表T,对系统默认模式O2进行约束补全,包括上下位关系补全,定义域值域补全与属性约束补全;上下文关系补全遍历用户模式O1中类和属性的父类和父属性,根据模式匹配表T,补充到系统默认模式O2对应项中;定义域值域补全遍历用户模式O1中属性和关系,根据模式匹配表T,补充到系统默认模式O2对应项中;属性约束补全遍历用户模式O1中属性约束,根据模式匹配表T,补充到系统默认模式O2对应项中;
步骤S3、上传资源:
用户根据用户模式描述的数据格式上传资源,利用步骤S2所述用户模式和模式匹配表对资源进行正确性校验,并对资源进行统一描述,将资源加入到资源入库队列中;
步骤S4、图谱构建:
从步骤S3所述资源入库队列中取出资源,与知识图谱中的资源进行对齐与融合,新资源加入到知识图谱中,利用Trans系列算法对知识图谱进行训练,得到知识表示学习模型。
2.根据权利要求1所述的基于众包的知识图谱构建方法,其特征在于所述步骤S1中,用户从图数据库容器集群分配图数据库容器,分配RDF数据库存储空间,分配Trans模型存储空间。
3.根据权利要求1所述的基于众包的知识图谱构建方法,其特征在于所述步骤S4的具体步骤如下:
步骤S41、从步骤S3所述资源入库队列中取出待入库资源e1,计算待入库资源e1与知识图谱中每一个同类资源e2的相似度res_sim(e1,e2),取知识图谱中与待入库资源相似度最高且大于阈值的同类资源作为对齐资源,若知识图谱中不存在相似度大于阈值的资源,则认为待入库资源是一个新资源;
步骤S42、若步骤S41所述待入库资源e1未找到匹配的资源e2,则认为e1是一个新资源,直接添加到知识图谱中,若待入库资源e1找到了匹配的资源e2,对于e1的每一个属性attr1i,与e2中对应的属性attr2i有三种对应情况:(1)attr2i不存在,则将attr2i的值设为attr1i;(2)attr2i存在,且与attr1i相同,忽略;(3)attr2i存在,且与attr1i不相同,将attr1i补充到attr2i中;
步骤S43、将融合结果更新到图数据库中;
步骤S44、使用开源的OpenKE框架对知识图谱进行训练,得到一系列Trans模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911399693.5/1.html,转载请声明来源钻瓜专利网。