[发明专利]基于多尺度分散动态路由的知识图谱补全方法及系统在审
申请号: | 202210390059.0 | 申请日: | 2022-04-14 |
公开(公告)号: | CN114741532A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 尉秀梅;马浩翔;姜雪松;柴慧慧;陈珺;陈佃迎 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 于凤洋 |
地址: | 250353 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 分散 动态 路由 知识 图谱 方法 系统 | ||
本发明提出了一种基于多尺度分散动态路由的知识图谱补全方法及系统,对获取的待补全三元组使用多头注意力机制与记忆矩阵循环交互,编码实体和关系之间的潜在依赖关系,生成三元组编码向量;将三元组编码向量,输入到训练好的胶囊网络中,提取全局特征,并为全局特征分配不同的耦合系数,根据全局特征预测缺失的三元组,完成知识图谱的补全;本发明在知识图谱预测时对实体之间潜在的依赖关系进行有效建模,尽可能地减少预测时动态路由造成的偏差,捕获不同抽象层次的特征,从而提高知识图谱补全预测精度和三元组分类的效果。
技术领域
本发明属于知识图谱技术领域,尤其涉及基于多尺度分散动态路由的知识图谱补全方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
知识图谱(KG)是由谷歌在2012年提出的,通常被表达为一个多关系图谱,是一个事实三要素的集合,世界上有大量的事实可以简单地表示为实体和它们之间的关系,YAGO、Freebase和DBpedia通常是以事实(头实体、关系、尾实体)的形式表示实体之间的关系的KGs,表示为(h;r;t),例如(“北京”,“属于”,“中国”);在推荐系统、问题回答、信息检索和自然语言处理领域可以用知识图谱来刻画三元关系,然而,大型知识图谱,即使包含数十亿的三要素,仍然是不完整的,即缺少很多有效的三要素。
因此,很多研究工作都集中在知识图谱的补全上,包括给定头实体和关系,预测尾实体,或者给定尾实体和关系,预测头实体,其目的是预测知识图谱中缺失的三元组,很多学习知识图谱中实体和关系低维表示的嵌入方法被提出来,也已被证明是可扩展和有效的;此外,知识图谱预测的准确性也可以通过一些优化方法来提高;通过使用这些知识图谱的嵌入模型可以有效的对不完整的知识图谱进行预测补全。
现有的知识图谱补全方法大多是通过简单的线性变换将三元组嵌入到连续的低维向量空间中,尽管计算效率高,但这些模型的拟合能力并不理想;Chen,Yang等人提出了一种多尺度的胶囊网络模型MCapsE,从深度的角度对嵌入向量之间的关系进行建模,在胶囊网络的卷积层中使用具有不同窗口大小的卷积核提取三元组中实体和关系的语义特征,然后通过胶囊层中的路由过程算法将这些语义特征表示为连续向量进行知识图谱的补全研究。Nguye等人提出了一种新的嵌入模型R-MeN,用关系记忆网络来编码关系三元组中的潜在依赖关系,R-MeN将每个三元组视为3个输入向量的序列,这些向量使用Transformer自注意机制与内存循环交互,对来自内存和每个输入向量之间交互的新信息进行编码,以返回相应的向量,R-MeN将这3个返回的向量提供给基于卷积神经网络的解码器,以生成三元组的标量分数,进行知识图谱的分类。
现有方法的不足点:
1)MCapsE通过在卷积层中使多尺度的卷积核改进CapsE,提高了模型提取三元组的语义特征,但仅扩展胶囊网络模型无法有效地捕获实体之间的潜在依赖关系;2)而R-MeN,尽管可以很好地提取不同语义空间中实体之间的潜在依赖关系,但受限于卷积神经网络编码效率低的弊端;3)而且由于胶囊网络中的动态路由部分使用的Softmax函数会导致预测向量的错误求和,这会影响预测的最终结果,DE-CapsNet模型使用了含有Sigmoid函数的分散动态路由对胶囊网络进行了改进,在图像分类领域数据集CIFAR-10和F-MNIST现出非常好的性能,但在知识图谱补全领域并没有得到应用。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于多尺度分散动态路由的知识图谱补全方法及系统,在知识图谱预测时对实体之间潜在的依赖关系进行有效建模,尽可能地减少预测时动态路由造成的偏差,捕获不同抽象层次的特征,从而提高知识图谱预测补全的准确度。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
本发明第一方面提供了基于多尺度分散动态路由的知识图谱补全方法;
基于多尺度分散动态路由的知识图谱补全方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210390059.0/2.html,转载请声明来源钻瓜专利网。