[发明专利]基于子图关系模式的知识图谱增强方法及装置、存储介质在审
申请号: | 202010140148.0 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111339218A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 郑博 | 申请(专利权)人: | 北京松鼠山科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/901 |
代理公司: | 北京卓唐知识产权代理有限公司 11541 | 代理人: | 卜荣丽 |
地址: | 100020 北京市朝阳区利*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关系 模式 知识 图谱 增强 方法 装置 存储 介质 | ||
1.一种基于子图关系模式的知识图谱增强方法,其特征在于,包括:
将基于自动知识获取KA所得的一个预测关系加入当前知识图谱KG中,并基于所述预测关系对KG进行子图拓展得到预测子图;
采用引导抽样的方式在所述KG中选出预设数量的与预测关系标签相同的边作为中心边,并对所述中心边进行子图拓展得到对应的决策子图,所述预测关系标签为所述预测子图中各边的标签;
计算所述预测子图和所有决策子图的关系串,所述关系串为一系列大小相等的有向边的集合;
根据所述关系串调整KA的预测关系,将概率最高的预测关系加入所述KG中。
2.根据权利要求1所述的方法,其特征在于,所述子图拓展的过程是:以任一给定边的两个实体为起点,将所有通过与半径相同步数即可达到的实体和探索过程经过的边纳入KG中得到拓展后子图的过程。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
对所述KG中的一个给定的边进行指定范围的子图拓展,并维护子图中的所有实体间的关系。
4.根据权利要求1所述的方法,其特征在于,所述关系串中均含有所述中心边。
5.根据权利要求4所述的方法,其特征在于,所述关系串的大小为|R|,关系串中任一关系一端的深度为L,另一端的深度为|R|-L-1。
6.根据权利要求5所述的方法,其特征在于,所述计算所述预测子图和所有决策子图的关系串,包括:
以所述预测子图和所有决策子图中任一关系两端的实体为起点,在L自1到|R|逐一增加的过程中,每取一个新的L值就对两端的实体进行对应深度的深度优选搜索DFS;
将两端每次分别DFS所得的结果进行笛卡尔乘积,并将乘积结果加入关系串的集合中。
7.根据权利要求1所述的方法,其特征在于,所述根据所述关系串调整KA的预测结果,将概率最高的预测关系加入所述KG中,包括:
计算所述预测子图的关系串与各个决策子图的关系串之间的相似度;
根据所述相似度确定所述KG对所述预测子图中预测关系的第一预测概率;
将所述第一预测概率和第二预测概率的乘积作为联合预测概率,其中所述第二预测概率为采用KA手段针对非结构化信息得到的预测概率;
根据所述联合预测概率调整KA的预测关系,将概率最高的预测关系加入所述KG中。
8.一种基于子图关系模式的知识图谱增强装置,其特征在于,包括:
预测子图拓展模块,用于将基于自动知识获取KA所得的一个预测关系加入当前知识图谱KG中,并基于所述预测关系对KG进行子图拓展得到预测子图;
决策子图拓展模块,用于采用引导抽样的方式在所述KG中选出预设数量的与预测关系标签相同的边作为中心边,并对所述中心边进行子图拓展得到对应的决策子图,所述预测关系标签为所述预测子图中各边的标签;
关系串计算模块,用于计算所述预测子图和所有决策子图的关系串,所述关系串为一系列大小相等的有向边的集合;
KG更新模块,用于根据所述关系串调整KA的预测关系,将概率最高的预测关系加入所述KG中。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一项所述的基于子图关系模式的知识图谱增强方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的基于子图关系模式的知识图谱增强方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京松鼠山科技有限公司,未经北京松鼠山科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010140148.0/1.html,转载请声明来源钻瓜专利网。